| Ver tema anterior :: Ver tema siguiente |
| Autor |
Mensaje |
juanpr Olé sí que era un buen buscador
Registrado: 27 Feb 2008 Mensajes: 30
|
Publicado: Dom Sep 07, 2008 2:16 pm Asunto: Filtrar con robot.txt si la url contiene una cadena concreta |
|
|
Hola, en una de mis webs necesito filtrar con robots.txt para que se no indexen las paginas que cambian la ordenacion de los resultados...
Ejemplo...
La url para mi categoria de botijos podria ser:
http://miweb . com/botijos.htm
Pero si tengo 1000 botijos, y los muestro de 100 en 100, habrá enlaces a las paginas siguientes del estilo : ...../botijos.html?posicion=2
con lo que google iria buscando por esos enlaces para obtener todos mis botijos.
El caso es que podria ordenar los botijos por capacidad y las urls serían
.../botijos.html?orderby=capacidad
y aparecerian tambien el resto de enlaces a las paginas siguientes ordenadas por capacidad...
Pero a mi me interesa que solo indexe las url que no tienen el texto 'orderby'...
Lo podria hacer con el robots.txt??? o mejor con 'nofollow' ???
Graciass |
|
| Volver arriba |
|
 |
erpepe Me paso horas con Ask Jeeves
Registrado: 02 Jun 2005 Mensajes: 211
|
|
| Volver arriba |
|
 |
juanpr Olé sí que era un buen buscador
Registrado: 27 Feb 2008 Mensajes: 30
|
Publicado: Dom Sep 07, 2008 8:28 pm Asunto: |
|
|
es una solución, pero si tengo 1000 categorías de botijos, tendría que escribir las 1000 categorías en el robots.txt
Lo que me haría falta seria algo del estilo: *&orderby* para que filtre todas las que tengan la cadena &orderby pero no se si es válido poner * en el robots.txt... |
|
| Volver arriba |
|
 |
juanpr Olé sí que era un buen buscador
Registrado: 27 Feb 2008 Mensajes: 30
|
Publicado: Dom Sep 07, 2008 8:35 pm Asunto: |
|
|
Solucionado, con las herramientas de webmaster de google donde se puede comprobar si el robots.txt filtra la url que pruebas ha funcionado con esto:
Disallow: *orderby* |
|
| Volver arriba |
|
 |
erpepe Me paso horas con Ask Jeeves
Registrado: 02 Jun 2005 Mensajes: 211
|
Publicado: Lun Sep 08, 2008 7:42 am Asunto: |
|
|
google admite expresiones regulares en robots.txt, ademas puedes comprobar su validez en webmastertools, esto tendria que ser suficiente para prohibir cualquier pagina o grupo de paginas. _________________ Hoteles en España
Hoteles en barcelona |
|
| Volver arriba |
|
 |
|