Foro de Xeoweb Foro de Posicionamiento y Buscadores
Aprendiendo a Promocionar Páginas Web.
Xeoweb :: Sindicar
 
 FAQFAQ   BuscarBuscar   MiembrosMiembros   Grupos de UsuariosGrupos de Usuarios   RegistrarseRegistrarse 
 PerfilPerfil   Entre para ver sus mensajes privadosEntre para ver sus mensajes privados   LoginLogin 
Estrategia para evitar contenido duplicado en joomla

 
Publicar nuevo tema   Responder al tema    Foros de discusión -> Foro Seo
Ver tema anterior :: Ver tema siguiente  
Autor Mensaje
RuymanTf
Lo mío es Gigablast


Registrado: 08 Oct 2007
Mensajes: 109
Ubicación: Tenerife, España

MensajePublicado: Dom May 04, 2008 5:50 pm    Asunto: Estrategia para evitar contenido duplicado en joomla Responder citando

En las webs hechas con Joomla según la estructura , no tienes tanto problema con los contenidos duplicados como en wordpress ya que por defecto no puedes acceder de tantas maneras diferentes al mismo contenido, por ejemplo en wordpress puedes acceder a través de las categorías, tags etc.

Las primeras medidas que tomo con joomla para evitar el contenido duplicado es que se pueda acceder solo con las www o sin ellas, restringir el acceso a los feeds, que siempre se acceda con una barra / al final de la url ...

Normalmente tienen estructuras sencillas sin muchas secciones o contenidos así que es fácil controlarlo. Pero ahora me surge una duda con una en la que existe una sección de noticias. Estas noticias van pasando por la portada y además va el texto completo, sin el típico leer más, con lo que ya estaría duplicando el contenido de la portada, la única solución para esto sería que el contenido no estuviera completo en portada, pero no me convence, y como ese contenido esta en portada de manera temporal tampoco me parece muy importante. En la portada existe fijo un articulo de contenido que nunca cambia y 2 noticias que van rotando.

Para los que les pido consejo es para esa sección noticias, las noticias a la vez que están en portada están en esa sección también y además a través de su url particular p.ej:
- dominio.com
- dominio.com/noticias/noticia1
- dominio.com/categoria/noticia1

La solución esta clara, restringir mediante robots.txt el acceso a la sección noticias (2º url), el problema que no tengo enlaces a cada unos de las noticias para que los bots lo rastreen, se supone que para eso esta el sitemap, pero creo que no es bueno que no exista ningún enlace hacía estas noticias ya sea interno o externo. La solución que se me ha ocurrido es enlazar con la lista de la sección noticias, en la que solo aparecerían lo enlaces hacía cada una de las noticias.

Relacionado con esto también, normalmente tanto el enlace hacia el mapa web en html, como la misma página de este mapa web en html se suelen poner como noindex y nofollow. El nofollow en el enlace lo entiendo, ya que si no estarías trasmitiendo pr y normalmente no interesa. Pero ¿porque no interesa que se indexe un mapa web en html? Creo que en principio para sitios webs pequeños es bastante recomendable porque te aseguras que los buscadores puedan rastrear absolutamente todo el contenido de tu web, se supone que para eso esta la versión xml, pero ¿que problema existe por que rastreé el html también?

Perdonen por el tocho Rolling Eyes
_________________
Servicio técnico informático
Diseño web Tenerife
Volver arriba
Ver perfil de usuario Enviar mensaje privado Visitar sitio web del autor MSN Messenger
gonzita
Me gusta MSN!


Registrado: 10 Dic 2004
Mensajes: 504
Ubicación: Bariloche, Argentina

MensajePublicado: Lun May 05, 2008 12:08 am    Asunto: Responder citando

Una cosa es la invención "rel=nofollow" de Matt Cuts de Google para los enlaces, y otra cosa muy distinta es la especificación del valor nofollow en las meta "robots" (un estandar de w3c).

Se suele confundir estas dos cuestiones, pensando que es lo mismo.

Si un enlace tiene el atributo rel=nofollow, Google seguirá ese enlace pero no indexará su página destino (por lo menos gracias a él), y el enlace en cuestión no le transmitirá page rank tampoco. Otros buscadores tienen otros comportamientos ante este atributo. Mirá esto: http://en.wikipedia.org/wiki/Nofollow


Cita:
¿porque no interesa que se indexe un mapa web en html? Creo que en principio para sitios webs pequeños es bastante recomendable porque te aseguras que los buscadores puedan rastrear absolutamente todo el contenido de tu web, se supone que para eso esta la versión xml, pero ¿que problema existe por que rastreé el html también?


HTML y XML son formatos distintos que se utilizan para diferentes finalidades. XML se usa cada vez más para almacenar datos en ese formato estándar porque las etiquetas son "extensibles", es decir, definidas por el usuario. XML es el formato de los mapas de sitio cargables desde Google Webmaster Tools, pero la razón de ser de un sitemap no varía con su formato.

Creo que tu confusión viene por el lado del "noindex" del mapa de sitio: ¿para qué querés que se indexe el sitemap, si solo debe servirte para que el robot/usuario encuentre los enlaces en él?

Con este ejemplo te quedará claro. Si en las meta robots utilizas "noindex,follow" le dices al robot: "no indexes esta página pero sigue sus enlaces", si en cambio usas "index,nofollow" le indicas: "indexa este documento pero no sigas sus enlaces".

Saludos!
_________________
Curso de Posicionamiento en Buscadores -

Blog de SEO, SEM y SMO -
Volver arriba
Ver perfil de usuario Enviar mensaje privado Visitar sitio web del autor
RuymanTf
Lo mío es Gigablast


Registrado: 08 Oct 2007
Mensajes: 109
Ubicación: Tenerife, España

MensajePublicado: Lun May 05, 2008 9:02 am    Asunto: Responder citando

Gracias gonzita, el primer concepto lo tenía claro al igual que la diferencia entre html y xml Wink

Lo que me ayuda es el meta noindex, creía que en este caso no indexaba la pagina, y por tanto no la leía, el mismo resultado que si a través del robots no permitiera el acceso a esa sección.

Sabiendo que si lee el contenido, efectivamente me parece razonable el uso del meta noindex,follow.

Gracias de nuevo
_________________
Servicio técnico informático
Diseño web Tenerife
Volver arriba
Ver perfil de usuario Enviar mensaje privado Visitar sitio web del autor MSN Messenger
gonzita
Me gusta MSN!


Registrado: 10 Dic 2004
Mensajes: 504
Ubicación: Bariloche, Argentina

MensajePublicado: Lun May 05, 2008 12:12 pm    Asunto: Responder citando

Claro, en el caso de "noindex,follow" lee el contenido en búsqueda de etiquetas "a" que enlazan otros documentos mediante "href" precisamente para seguir esos enlaces e indexar (si se les permite) las páginas destino.
_________________
Curso de Posicionamiento en Buscadores -

Blog de SEO, SEM y SMO -
Volver arriba
Ver perfil de usuario Enviar mensaje privado Visitar sitio web del autor
Mostrar mensajes de anteriores:   
Publicar nuevo tema   Responder al tema    Foros de discusión -> Foro Seo Todas las horas son GMT
Respuesta Rápida y Acciones
 

 

Página 1 de 1


Cambiar a:  
Puede publicar nuevos temas en este foro
No puede responder a temas en este foro
No puede editar sus mensajes en este foro
No puede borrar sus mensajes en este foro
No puede votar en encuestas en este foro

 


Logo diseñado por iLevante
Powered by phpBB © 2001, 2009 phpBB Group