Todos recordamos la historia del nofollow. A mi me quedaron grabados muchos de los comentarios que leí sobre el tema. El caso lo traté como blogger (¿algún sinónimo para blogger? Cada vez me gusta menos la palabra.) que escribía en xeoweblog y para los bloggers que leían el blog, criticando el atributo, ya que no valía en absoluto para lo que nos lo estaban vendiendo. El tiempo nos dio la razón.
Me río de algún blogger que dijo que a los SEOs (nunca me he autodenominado de tal forma, aunque claro está, me doy por aludido), el nofollow nos perjudicaba y por eso nunca lo aprobaríamos. Curioso que Sullivan (máximo representante internacional SEO/SEM) lo defendiese. Yo sólo critiqué aquel atributo como blogger (vaya denominaciones que nos damos), paradójicamente a mi se me criticó por mi opinión siendo SEO. Como persona que vive día a día el tema de los buscadores, me río de la posibilidad que tiene un blogger medio de quitarle partido a este atributo, y mucho más de aquellos que - con muy poca idea de lo que hablaban - , criticaban a un posicionador profesional metido a labores de bloguero.
Dejando las críticas retorcidas hacia todos aquellos implícitamente mencionados. Quiero escribir diferentes ideas para aprovechar el atributo nofollow. Claro está que hay que tener una ligera idea de buscadores para poder utilizarlo.
Dejadme poner un ejemplo claro. www.xeoweb.biz tiene a todas las páginas Add Url el enlace puesto con nofollow. Actualmente hay 500 categorías en el directorio, unas 500 páginas. En total serían 1000 páginas con la correspondiente página Add Url de cada categoría. ¿Qué estoy diciendo? Que nos hemos ahorrado que los robots entren en 500 páginas con el ahorro de consumo de ancho de banda pertinente. Estoy pensando en alguna forma de implementarlo en wordpress para mejorar su indexación y evitar el problema de los duplicados (por dar que hablar
).
En cambio, con el nofollow, Google no entrará ni mirará ese enlace. A no ser que alguien nos enlace sin el nofollow. En la mayoría de casos no será así, si utilizamos el nofollow para que no se nos indexen páginas a nivel interno, no tiene sentido que nos caigan enlaces a nivel externo. ¿Por qué alguien iba a enlazar una página add url (este enlace que acabo de poner va con el nofollow, insisto en que no quiero que Google me indexe esas páginas, la indexación es mucho más limpia)?
Mi resumen nofollow:
Lo más destacable es el ahorro de consumo de ancho de banda. ¿Verdadero motivo de la implementación por parte de los buscadores? (Ellos ahorran recursos y todos salimos ganando.)
Sigo en contra del nofollow para su utilización a nivel de enlaces externos (¡Por supuesto!, ¡Qué nadie lo dude!, Vale, podéis borrar el punto 4
). Va en contra de Internet y su concepto de Red. Pero… ¿A nivel interno de una web? Utilizarlo para capar nuestras propias páginas según nos convenga es una idea que nos beneficia a nosotros y a los propios buscadores.
You must be logged in to post a comment.
29 queries. 0.466 seconds
May 3rd, 2005 at 2:04 pm
[…] scribiendo para usuarios, sin dejar de pensar en buscadores. « NoFollow, Un atributo verdaderamente útil. Cínicos Directo […]
May 3rd, 2005 at 3:03 pm
Me encanta la diferencia que has deducido entre el robots.txt y el reL=”nofollow”, la verdad que muy interesante
Una cosa, el ejemplo del uso del robots txt sería asi ¿no?. Porque en el robots dicesque no indexe el term.php
La utilización del Nofollow de la manera que explicas, sirve para orientar un mayor peso en la web a los enlaces que deseas y quitarselo a aquellos que no tienen un contenido claro, ¿no?, qué curioso.
May 3rd, 2005 at 3:27 pm
Sí, David, eso mismo. Puse esta búsqueda como ejemplo (terms.php me sale de primera), pero la que tu dices es más precisa.
Con esto que dices:
“La utilización del Nofollow de la manera que explicas, sirve para orientar un mayor peso en la web a los enlaces que deseas y quitarselo a aquellos que no tienen un contenido claro, ¿no?, qué curioso.”
Se podría hacer otro punto, porque explicitamente creo que no lo menciono.
Creo que la mayor utilidad podría quitársele en los scripts de los foros, porque es donde más duplicados se dan, no sé si en php-nuke tenéis estos problemas de duplicaciones.
Mirado de otra forma: Con el robots.txt le decimos a un buscador lo que no queremos que almacene en la caché, pero no le decimos que no indexe la URL, ni le decimos por donde tiene que ir. Con nofollow podemos guiar al robot para que siga los enlaces que nos de la gana y de la forma que queramos. Incluso se podría hacer un cloaking ético (¡casi nadie se enteraría!) que se basase sólo en decirle al robot lo que tiene que indexar y lo que no.
También es interesante la posibilidad de combinar el robots.txt con el nofollow. Por ejemplo si en el directorio a la página terms.php la capo con el robots y con el nofollow. Google no la va a indexar, y si la indexa es porque esa página concreta termps.php, ha recibido un enlace desde el exterior. Entonces todas urls sin descripción que tengamos, estarán indexadas, porque reciben enlaces desde el exterior.
May 3rd, 2005 at 4:36 pm
Utilizar el nofollow para evitar la indexación lo veo bien. Al igual que tu lo he puesto en algún sitio, pero voy a contar mi experiencia con el robots.txt ya que es algo dstinta a la tuya.
No he podido comprobar si Google lee las páginas y sigue sus enlaces, pero si que no aparece en las búsquedas
Al principio no tenía nada en el robots.txt y Google indexaba la versión para imprimir de las noticias, con lo feo que quedaba el contenido duplicado.
Puse este robotx.txt y parecía que Google no le hacia ni caso, pq no desindexaba las páginas y la verdad es que no se si cogía alguna nueva.
Fue entrar en http://services.google.com/urlconsole/controller y la cosa se solicionó: las páginas que había indexado anteriormente a la modificación del robots.txt se eliminaron y no ha vuelto a indexar ninguna versión para imprimir.
No se cual es el motivo por el que a tí te aparecen las terms.php, pero creo que sólo con el robots.txt se podría evitar que las cogiese, aunque me gusta usar tb el nofollow para eso.
May 3rd, 2005 at 4:43 pm
Parece que no puse bien el enlace de la búsqueda de Google, lo pongo aquí, pero si puedes cambialo en el mensaje anterior y así queda un único comentario
http://www.google.es/search?hl=es&q=site%3Avalledelkas.com+print
May 3rd, 2005 at 4:48 pm
Nos desviamos un poco hacia el robots. En todos los casos que he visto en los últimos meses el robots indexa las urls, siempre. No muestra descripción pero siempre se queda con la url y la muestra en las búsquedas. Ya pongas el robots.txt antes de que te indexe la web o después.
Tal y como lo cuentas, una vez que tienes las páginas indexadas y pones el robots.txt puede pasar mes y medio hasta “desindexarte” (en quitarte la descripción porque se va a quedar con la url). Por lo que yo me plantearía que es un caso diferente el que planteas, que tus páginas desaparecieron porque lo solicitaste tú con la consola. Por cierto que nunca he usado esa consola, tal y como lo cuentas debe funcionar bien, ¿puedes desindexar grupos de páginas dentro de una web en función de su url?
May 3rd, 2005 at 8:56 pm
No entiendo esto último. Si es para Disallow:hola.php? funciona. Yo lo he probado varias veces en pocos minutos pasó el robot y se llevó todo lo que le mandé (de paso indexó otras para compensar, curioso, quizá lo pruebe a ver si es norma general).
May 3rd, 2005 at 8:57 pm
Ha, no os alarméis, tampoco me indexó tanto.
May 3rd, 2005 at 8:58 pm
¿En pocos minutos? Ya me dirás como haces para llamar al robot
, a mi me tarda varias semanas cada cambio.
May 3rd, 2005 at 9:28 pm
Es necesario solicitar el paso del robot a traves de la consola para que tome en cuenta el fichero para las páginas viejas.
Si no pasa por la consola puede tardar meses, pero una vez que se lo indicas, en 24 horas tendrá en cuenta lo que hayas puesto en el robots.txt, desindexando las páginas, pero no sólo la descripción, sino tb la url.
Una vez q las ha quitado no he podido ver una página en google que esté con un disallow en el robots.txt, pero eso si, hay que decirselo con la consola.
Prueba a llamar al robots.txt desde la consola y mira a ver si te quita el terms.php que tienes por ahi danzando, debería hacerlo.
En la consola si puedes decirle que desindexe grupos de páginas, pero siempre y cuando no tengan comodines en ellas, es decir, puedes tener en el robots.txt un disallow: print.asp y eso te quitará las páginas de la forma print.asp?id=NNN pero no puedes decirle un dissallow: tema-*.php como por ejemplo sucede con foros con mod_rewrite.
La consola sirver para decirle a Google: “oye, pasa por mi página rápido y teneme en cuenta el robots.txt, tanto para las páginas que tengas indexadas, como para las nuevas”
May 3rd, 2005 at 9:34 pm
Y yo sin conocer el invento este, bueno ahora voy a echarle un vistazo, ya os comentaré cuando aprenda como funciona.
May 3rd, 2005 at 9:48 pm
Alfredo, ya sé lo qué es esto, pero nunca tuve necesidad de utlizarlo. Realmente es algo diferente a lo que comentaba en el post.
En el post hablo de un tratamiento normal del robots.txt, sin necesidad de pedir estos servicios.
El servicio este es para eliminar webs o páginas del buscador, por el motivo que sea no nos interesan que sean indexadas, ni siquiera que el robot se acerque a echarle un vistazo (eso suelen usarlo para imágenes con copyright e historias así). ¿Qué utilizan para saber que eres tu el que está solicitando este servicio? El robots.txt, pero ese robots no tiene porque ser tu robots habitual, entiendo que si tu ahora quitas tu robots, Google ya nunca más te va a visitar esas páginas. No me gusta demasiado jugar con esto.
De todas formas, es una manera interesante de lograr una indexación limpia. En el www.xeoweb.net/robots.txt no traga por los asteriscos (*). Más seguro me sigue pareciendo el nofollow para estos casos.
May 4th, 2005 at 12:59 am
[…] (Vía) se ha mencionado que los buscadores si que siguen los enlaces NoFollow. En mi post NoFollow: un atributo verdaderamente útil, el buscador caso de estudio fu […]
May 4th, 2005 at 4:27 pm
Alfredo, sí que es efectiva la consola, ya hizo lo que le mandé, y en estos momentos tengo una indexación 100% limpia.
May 4th, 2005 at 7:55 pm
Una pregunta ridícula ¿como te identificas en la consola?
May 4th, 2005 at 8:48 pm
Te registras con un e-mail y una password, y luego puedes pedir que pase por cualquier web, y lo comprueba mediante el robots.txt.
May 19th, 2005 at 6:15 pm
[…] PayPal en Español
NoFollow, Yahoo! y MSN
Continuación de NoFollow: un atributo verdaderamente útil y Pruebas NoFollow. Posts donde […]
July 4th, 2005 at 9:32 pm
Otra aplicación, puedes colocar un enlace en paginas de sexo con miles de visitas, ganar visitas
sin ser penalizado ni a nivel buscador ni a nivel adsense.
August 28th, 2005 at 7:19 pm
[…] Google tienen que apañárselas él solito, encontramos ni más ni menos a gente que apoyó el NoFollow. ¡Qué contradicción! ¿No es el nofollow una colaboración con los […]
August 29th, 2005 at 7:59 pm
[…] ¿No estaba el nofollow destinado a parar el spam en los blogs? (Y algunas cosas más, ver: NoFollow: un atributo verdaderamente útil). Pregunta número 2: Yo soy u […]
August 29th, 2005 at 11:23 pm
[…] ¿No estaba el nofollow destinado a parar el spam en los blogs? (Y algunas cosas más, ver: NoFollow: un atributo verdaderamente útil). Pregunta número 2: Yo soy u […]