Fran Weblog

    I just gave up a while back.

People never like me

3/5/2005

NoFollow, Un atributo verdaderamente útil.

by @ 12:55 am. Filed under Buscadores

Todos recordamos la historia del nofollow. A mi me quedaron grabados muchos de los comentarios que leí sobre el tema. El caso lo traté como blogger (¿algún sinónimo para blogger? Cada vez me gusta menos la palabra.) que escribía en xeoweblog y para los bloggers que leían el blog, criticando el atributo, ya que no valía en absoluto para lo que nos lo estaban vendiendo. El tiempo nos dio la razón.

Me río de algún blogger que dijo que a los SEOs (nunca me he autodenominado de tal forma, aunque claro está, me doy por aludido), el nofollow nos perjudicaba y por eso nunca lo aprobaríamos. Curioso que Sullivan (máximo representante internacional SEO/SEM) lo defendiese. Yo sólo critiqué aquel atributo como blogger (vaya denominaciones que nos damos), paradójicamente a mi se me criticó por mi opinión siendo SEO. Como persona que vive día a día el tema de los buscadores, me río de la posibilidad que tiene un blogger medio de quitarle partido a este atributo, y mucho más de aquellos que - con muy poca idea de lo que hablaban - , criticaban a un posicionador profesional metido a labores de bloguero.

Dejando las críticas retorcidas hacia todos aquellos implícitamente mencionados. Quiero escribir diferentes ideas para aprovechar el atributo nofollow. Claro está que hay que tener una ligera idea de buscadores para poder utilizarlo.

Verdaderas utilidades del nofollow.

  1. Reducir el consumo de ancho de banda. Estamos en una época en que los robots de los buscadores entran en nuestras webs y nos chupan varias Gigas al mes. Esto es un problema grave. Sólo Ask Jeeves me ha consumido 9 Gigas de ancho de banda entre Marzo y Abril en www.xeoweb.com. Pensar en esto teniendo un servidor compartido en España sería sinónimo de dejarse mucho dinero al mes por pasarnos de recursos. ¡Un Momento! ¿He dicho sólo Ask Jeeves? Ask Jeeves fue el único gran buscador que se negó a adoptar el nofollow como estándar porque no veía clara su utilidad contra el Spam. Tal vez Ask Jeeves se haya equivocado. Gracias al nofollow se puede controlar el ancho de banda que nos consumen Google Bot y Yahoo! Slurp. La idea es muy sencilla, en páginas dinámicas de igual contenido, que se repiten miles de veces en algunos scripts…¡No dejemos que los buscadores las lean! Un nofollow y arreglado.

    Dejadme poner un ejemplo claro. www.xeoweb.biz tiene a todas las páginas Add Url el enlace puesto con nofollow. Actualmente hay 500 categorías en el directorio, unas 500 páginas. En total serían 1000 páginas con la correspondiente página Add Url de cada categoría. ¿Qué estoy diciendo? Que nos hemos ahorrado que los robots entren en 500 páginas con el ahorro de consumo de ancho de banda pertinente. Estoy pensando en alguna forma de implementarlo en wordpress para mejorar su indexación y evitar el problema de los duplicados (por dar que hablar ;) ).

  2. Uno de los grandes fuertes del NoFollow (en este caso hablo de Google, con Yahoo! y MSN no estoy seguro) es que el tratamiento de “no-indexación” es completamente diferente al que sucede cuando usamos el robots.txt. Si a Google le decimos que no acceda a una página concreta por medio de robots.txt, Google accede, se queda con esa dirección y sigue enlaces, pero no la guarda en su caché. No se queda con copia de los datos. En el buscador se mostrará la URL sin descripción ni título. Un jemplo con su robots correspondiente.

    En cambio, con el nofollow, Google no entrará ni mirará ese enlace. A no ser que alguien nos enlace sin el nofollow. En la mayoría de casos no será así, si utilizamos el nofollow para que no se nos indexen páginas a nivel interno, no tiene sentido que nos caigan enlaces a nivel externo. ¿Por qué alguien iba a enlazar una página add url (este enlace que acabo de poner va con el nofollow, insisto en que no quiero que Google me indexe esas páginas, la indexación es mucho más limpia)?

  3. Utilizando nofollow a nivel internto podemos conseguir indexaciones mucho más limpias, son páginas que a nivel del buscador tal vez no, pero a nivel de usuarios tienen más valor. Para mi esto es una indexación limpia, y se ha logrado usando nofollow. Esto sería una indexación sucia, que he logrado utilizando el robots.txt. No me interesa que Google se quede con mis Urls si no va a mostrar descripción de las mismas. ¿De qué estoy hablando? De algo que se dejaba caer más arriba. Se puede aprovechar el nofollow para evitar el problema de las páginas duplicadas a nivel interno.
  4. En Google, el valor del texto de los enlaces tiene un peso especial para la propia página donde están. ¿Qué quiero decir? Que podemos manipular un factor on-the-page, gracias a un factor off-the-page, sin el consecuente beneficio del enlace para la página a la que apuntamos.

Mi resumen nofollow:

  1. Podemos ahorrar ancho de banda.
  2. Complemento ideal al robots.txt
  3. Podemos mejorar nuestra indexación. Solución al problema de los duplicados.
  4. Manipulación añadida de factores.

Lo más destacable es el ahorro de consumo de ancho de banda. ¿Verdadero motivo de la implementación por parte de los buscadores? (Ellos ahorran recursos y todos salimos ganando.)

Sigo en contra del nofollow para su utilización a nivel de enlaces externos (¡Por supuesto!, ¡Qué nadie lo dude!, Vale, podéis borrar el punto 4 ;) ). Va en contra de Internet y su concepto de Red. Pero… ¿A nivel interno de una web? Utilizarlo para capar nuestras propias páginas según nos convenga es una idea que nos beneficia a nosotros y a los propios buscadores.

21 Responses to “NoFollow, Un atributo verdaderamente útil.”

  1. Fran Weblog » Blog Archive » Cínicos Directorios Says:

    […] scribiendo para usuarios, sin dejar de pensar en buscadores. « NoFollow, Un atributo verdaderamente útil. Cínicos Directo […]

  2. Spacebom Says:

    Me encanta la diferencia que has deducido entre el robots.txt y el reL=”nofollow”, la verdad que muy interesante ;)

    Una cosa, el ejemplo del uso del robots txt sería asi ¿no?. Porque en el robots dicesque no indexe el term.php

    La utilización del Nofollow de la manera que explicas, sirve para orientar un mayor peso en la web a los enlaces que deseas y quitarselo a aquellos que no tienen un contenido claro, ¿no?, qué curioso.

  3. Fran Says:

    Sí, David, eso mismo. Puse esta búsqueda como ejemplo (terms.php me sale de primera), pero la que tu dices es más precisa.

    Con esto que dices:

    “La utilización del Nofollow de la manera que explicas, sirve para orientar un mayor peso en la web a los enlaces que deseas y quitarselo a aquellos que no tienen un contenido claro, ¿no?, qué curioso.”

    Se podría hacer otro punto, porque explicitamente creo que no lo menciono.

    Creo que la mayor utilidad podría quitársele en los scripts de los foros, porque es donde más duplicados se dan, no sé si en php-nuke tenéis estos problemas de duplicaciones.

    Mirado de otra forma: Con el robots.txt le decimos a un buscador lo que no queremos que almacene en la caché, pero no le decimos que no indexe la URL, ni le decimos por donde tiene que ir. Con nofollow podemos guiar al robot para que siga los enlaces que nos de la gana y de la forma que queramos. Incluso se podría hacer un cloaking ético (¡casi nadie se enteraría!) que se basase sólo en decirle al robot lo que tiene que indexar y lo que no.

    También es interesante la posibilidad de combinar el robots.txt con el nofollow. Por ejemplo si en el directorio a la página terms.php la capo con el robots y con el nofollow. Google no la va a indexar, y si la indexa es porque esa página concreta termps.php, ha recibido un enlace desde el exterior. Entonces todas urls sin descripción que tengamos, estarán indexadas, porque reciben enlaces desde el exterior.

  4. Alfredo Says:

    Utilizar el nofollow para evitar la indexación lo veo bien. Al igual que tu lo he puesto en algún sitio, pero voy a contar mi experiencia con el robots.txt ya que es algo dstinta a la tuya.

    No he podido comprobar si Google lee las páginas y sigue sus enlaces, pero si que no aparece en las búsquedas

    Al principio no tenía nada en el robots.txt y Google indexaba la versión para imprimir de las noticias, con lo feo que quedaba el contenido duplicado.

    Puse este robotx.txt y parecía que Google no le hacia ni caso, pq no desindexaba las páginas y la verdad es que no se si cogía alguna nueva.

    Fue entrar en http://services.google.com/urlconsole/controller y la cosa se solicionó: las páginas que había indexado anteriormente a la modificación del robots.txt se eliminaron y no ha vuelto a indexar ninguna versión para imprimir.

    No se cual es el motivo por el que a tí te aparecen las terms.php, pero creo que sólo con el robots.txt se podría evitar que las cogiese, aunque me gusta usar tb el nofollow para eso.

  5. Alfredo Says:

    Parece que no puse bien el enlace de la búsqueda de Google, lo pongo aquí, pero si puedes cambialo en el mensaje anterior y así queda un único comentario ;)

    http://www.google.es/search?hl=es&q=site%3Avalledelkas.com+print

  6. Fran Says:

    Nos desviamos un poco hacia el robots. En todos los casos que he visto en los últimos meses el robots indexa las urls, siempre. No muestra descripción pero siempre se queda con la url y la muestra en las búsquedas. Ya pongas el robots.txt antes de que te indexe la web o después.

    Tal y como lo cuentas, una vez que tienes las páginas indexadas y pones el robots.txt puede pasar mes y medio hasta “desindexarte” (en quitarte la descripción porque se va a quedar con la url). Por lo que yo me plantearía que es un caso diferente el que planteas, que tus páginas desaparecieron porque lo solicitaste tú con la consola. Por cierto que nunca he usado esa consola, tal y como lo cuentas debe funcionar bien, ¿puedes desindexar grupos de páginas dentro de una web en función de su url?

  7. Davilac Says:

    No entiendo esto último. Si es para Disallow:hola.php? funciona. Yo lo he probado varias veces en pocos minutos pasó el robot y se llevó todo lo que le mandé (de paso indexó otras para compensar, curioso, quizá lo pruebe a ver si es norma general).

  8. Davilac Says:

    Ha, no os alarméis, tampoco me indexó tanto.

  9. Fran Says:

    ¿En pocos minutos? Ya me dirás como haces para llamar al robot ;) , a mi me tarda varias semanas cada cambio.

  10. Alfredo Says:

    Es necesario solicitar el paso del robot a traves de la consola para que tome en cuenta el fichero para las páginas viejas.

    Si no pasa por la consola puede tardar meses, pero una vez que se lo indicas, en 24 horas tendrá en cuenta lo que hayas puesto en el robots.txt, desindexando las páginas, pero no sólo la descripción, sino tb la url.

    Una vez q las ha quitado no he podido ver una página en google que esté con un disallow en el robots.txt, pero eso si, hay que decirselo con la consola.

    Prueba a llamar al robots.txt desde la consola y mira a ver si te quita el terms.php que tienes por ahi danzando, debería hacerlo.

    En la consola si puedes decirle que desindexe grupos de páginas, pero siempre y cuando no tengan comodines en ellas, es decir, puedes tener en el robots.txt un disallow: print.asp y eso te quitará las páginas de la forma print.asp?id=NNN pero no puedes decirle un dissallow: tema-*.php como por ejemplo sucede con foros con mod_rewrite.

    La consola sirver para decirle a Google: “oye, pasa por mi página rápido y teneme en cuenta el robots.txt, tanto para las páginas que tengas indexadas, como para las nuevas”

  11. Fran Says:

    Y yo sin conocer el invento este, bueno ahora voy a echarle un vistazo, ya os comentaré cuando aprenda como funciona.

  12. Fran Says:

    Alfredo, ya sé lo qué es esto, pero nunca tuve necesidad de utlizarlo. Realmente es algo diferente a lo que comentaba en el post.

    En el post hablo de un tratamiento normal del robots.txt, sin necesidad de pedir estos servicios.

    El servicio este es para eliminar webs o páginas del buscador, por el motivo que sea no nos interesan que sean indexadas, ni siquiera que el robot se acerque a echarle un vistazo (eso suelen usarlo para imágenes con copyright e historias así). ¿Qué utilizan para saber que eres tu el que está solicitando este servicio? El robots.txt, pero ese robots no tiene porque ser tu robots habitual, entiendo que si tu ahora quitas tu robots, Google ya nunca más te va a visitar esas páginas. No me gusta demasiado jugar con esto.

    De todas formas, es una manera interesante de lograr una indexación limpia. En el www.xeoweb.net/robots.txt no traga por los asteriscos (*). Más seguro me sigue pareciendo el nofollow para estos casos.

  13. Fran Weblog » Blog Archive » Pruebas NoFollow Says:

    […] (Vía) se ha mencionado que los buscadores si que siguen los enlaces NoFollow. En mi post NoFollow: un atributo verdaderamente útil, el buscador caso de estudio fu […]

  14. Fran Says:

    Alfredo, sí que es efectiva la consola, ya hizo lo que le mandé, y en estos momentos tengo una indexación 100% limpia.

  15. Spacebom Says:

    Una pregunta ridícula ¿como te identificas en la consola?

  16. Fran Says:

    Te registras con un e-mail y una password, y luego puedes pedir que pase por cualquier web, y lo comprueba mediante el robots.txt.

  17. Fran Weblog » Blog Archive » NoFollow, Yahoo! y MSN Says:

    […] PayPal en Español

    NoFollow, Yahoo! y MSN

    Continuación de NoFollow: un atributo verdaderamente útil y Pruebas NoFollow. Posts donde […]

  18. ab_ Says:

    Otra aplicación, puedes colocar un enlace en paginas de sexo con miles de visitas, ganar visitas
    sin ser penalizado ni a nivel buscador ni a nivel adsense.

  19. Fran Weblog » Blog Archive » Reflexiones al Azar Says:

    […] Google tienen que apañárselas él solito, encontramos ni más ni menos a gente que apoyó el NoFollow. ¡Qué contradicción! ¿No es el nofollow una colaboración con los […]

  20. Fran Weblog » Blog Archive » NoFollow y Venta de Enlaces Says:

    […] ¿No estaba el nofollow destinado a parar el spam en los blogs? (Y algunas cosas más, ver: NoFollow: un atributo verdaderamente útil). Pregunta número 2: Yo soy u […]

  21. Fran Weblog » Blog Archive » NoFollow y Venta de Enlaces Says:

    […] ¿No estaba el nofollow destinado a parar el spam en los blogs? (Y algunas cosas más, ver: NoFollow: un atributo verdaderamente útil). Pregunta número 2: Yo soy u […]

Leave a Reply

You must be logged in to post a comment.




[WordPress]

Marketing:


Categorías:

Archivos:

Mayo 2005
L M M J V S D
« Abr   Jun »
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

Foros:

Directorios:

other:

Más Blogs:

Amigos:

Blogs:

27 queries. 0.473 seconds