Foro de Xeoweb Foro de Posicionamiento y Buscadores
Aprendiendo a Promocionar Páginas Web.
Xeoweb :: Sindicar
 
 FAQFAQ   BuscarBuscar   MiembrosMiembros   Grupos de UsuariosGrupos de Usuarios   RegistrarseRegistrarse 
 PerfilPerfil   Entre para ver sus mensajes privadosEntre para ver sus mensajes privados   LoginLogin 
Google ignora sus propias recomendaciones

 
Publicar nuevo tema   Responder al tema    Foros de discusión -> Foro Seo
Ver tema anterior :: Ver tema siguiente  
Autor Mensaje
qwerty_wq
AllTheWeb fue el mejor


Registrado: 31 May 2005
Mensajes: 76

MensajePublicado: Mar Ene 06, 2009 9:30 am    Asunto: Google ignora sus propias recomendaciones Responder citando

Llevaba tiempo viendo crecer de forma impresionante el número de páginas indexadas en una de las webs que llevo, así que hoy me puse a investigar y resulta que de cerca de 80000 páginas indexadas, más de la mitad corresponden a páginas con etiqueta noindex,nofollow y restringidas por robots.txt. En el índice de Google aparecen listadas con la URL por título y sin descripción ni posibilidad de acceso a la cache, pero curiosamente con la opción de traducción.

Resulta que las páginas están todas dentro de un directorio /usuario/ que, obviamente, corresponde a opciones de usuarios y a perfiles de los mismos. Y lo más curioso es que cuando accedo a la herramienta de "Análisis de robots.txt" de Webmasters Tools, y pruebo a introducir las URLs que me ha indexado me aparece que están bloqueadas en base a mi archivo robots.txt actual. Además, todas estas URLs me aparecen como "bloqueadas" en el diagnóstico del rastreo. Es más, como dije antes, cada página muestra una META noindex,nofollow que es un copy&paste exacto de la que recomienda Google.

¿Alguien sabe qué cachondeo es éste? Y lo peor de todo es que esas páginas casi no tienen contenido, ya que se basan exclusivamente en formularios, que son todos iguales.

¿Ha podido penalizarme Google por tener tantas páginas iguales indexadas?

Desde luego, lo que pienso hacer es mostrar un error 404 a Googlebot, esperemos a ver si se digna a desindexarme las páginas que no tenía que indexarme, porque esto no es serio.

Menudo cabreo me llevo encima Evil or Very Mad Evil or Very Mad Evil or Very Mad
Volver arriba
Ver perfil de usuario Enviar mensaje privado
carlose
Me gusta Terra como Buscador


Registrado: 03 Ene 2009
Mensajes: 10

MensajePublicado: Mar Ene 06, 2009 10:01 am    Asunto: Responder citando

A mí me paso algo similar. Me indexaba directorios restringidos por robots.txt
El problema estaba en que tenía puesto el generador de sitemap de Google de forma que rastreaba los logs del servidor para encontrar páginas. Entonces no respetaba el robots.txt

Solución: agregar una restricción para el directorio que no quería que se indexase en el generador de sitemap y dar de baja las url en webmaster tool.

Al día siguiente o a los 2 días desaparecieron de Google y no han vuelto a aparecer.

Espero que si tu caso no es el mismo por lo menos te pueda haber dado alguna idea, suerte.
Volver arriba
Ver perfil de usuario Enviar mensaje privado Visitar sitio web del autor
qwerty_wq
AllTheWeb fue el mejor


Registrado: 31 May 2005
Mensajes: 76

MensajePublicado: Mar Ene 06, 2009 10:21 am    Asunto: Responder citando

carlose escribió:
A mí me paso algo similar. Me indexaba directorios restringidos por robots.txt
El problema estaba en que tenía puesto el generador de sitemap de Google de forma que rastreaba los logs del servidor para encontrar páginas. Entonces no respetaba el robots.txt

Solución: agregar una restricción para el directorio que no quería que se indexase en el generador de sitemap y dar de baja las url en webmaster tool.

Al día siguiente o a los 2 días desaparecieron de Google y no han vuelto a aparecer.

Espero que si tu caso no es el mismo por lo menos te pueda haber dado alguna idea, suerte.


Muchas gracias por la idea, carlose, pero me temo que no es mi caso. La verdad es que esto de Google es un cachondeo, porque todos los que tenemos y administramos webs nos pegamos para que nos indexe el contenido lo mejor posible, y resulta que en mi caso la mayor parte de lo que tenía indexado era algo que yo no quería que se indexara.

Como dije, en cuanto tenga un rato libre implementaré una función para que muestre un error 404 a Googlebot, a Yahoo! Slurp y a todo bot que pueda fichar. A ver si ahora tiene lo que hay que tener como para indexar contenidos que "no existen" Evil or Very Mad
Volver arriba
Ver perfil de usuario Enviar mensaje privado
Mostrar mensajes de anteriores:   
Publicar nuevo tema   Responder al tema    Foros de discusión -> Foro Seo Todas las horas son GMT
Respuesta Rápida y Acciones
 

 

Página 1 de 1


Cambiar a:  
Puede publicar nuevos temas en este foro
No puede responder a temas en este foro
No puede editar sus mensajes en este foro
No puede borrar sus mensajes en este foro
No puede votar en encuestas en este foro

 


Logo diseñado por iLevante
Powered by phpBB © 2001, 2009 phpBB Group