¿Por qué algunos sitios web agregan “Slugs” al final de las URL?

Muchos sitios web, incluido este, agregan lo que aparentemente se denominan ” babosas” , descriptivos pero, por lo que puedo decir, bits inútiles de texto, hasta el final de las URL.

Por ejemplo, la URL que el sitio brinda para esta pregunta es:

https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

Pero la siguiente URL funciona igual de bien:

https://stackoverflow.com/questions/47427/

¿El objective de este texto es hacer que la URL sea más fácil de usar o hay algún otro beneficio?

Las babosas hacen que la URL sea más fácil de usar y usted sabe qué esperar cuando hace clic en un enlace. Los motores de búsqueda como Google clasifican las páginas más arriba si la palabra de búsqueda está en la URL.

La usabilidad es una de las razones, si recibe ese enlace en su correo electrónico, sabrá qué esperar. SEO (optimización de motores de búsqueda) es otra razón. Los motores de búsqueda como google clasificarán su página más arriba para las palabras clave que figuran en la url

Recientemente cambié el formato de URL de mi sitio web de:

http://www.mywebsite.com/index.asp?view=display&postid=100

A

http://www.mywebsite.com/this-is-the-title-of-the-post

y se dio cuenta de que las tasas de clics al artículo booston aproximadamente un 300% después del cambio. Ciertamente ayuda al usuario a decidir si lo que está pensando hacer clic es relevante, en términos de propósitos de SEO, aunque debo decir que he visto poco impacto después del cambio.

Estoy de acuerdo con otras respuestas que cualquier babosa mal escrita debe 301-redirigir a la forma correcta. En otras palabras, https://stackoverflow.com/questions/47427/wh debe redireccionar a https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls . Tiene otro beneficio que no se ha mencionado: si no se redirige a una URL canónica, parecerá que tiene un número casi infinito de páginas duplicadas. Google odia el contenido duplicado.

Dicho esto, en realidad solo debería preocuparse por la identificación del contenido y permitir cualquier entrada para la babosa siempre que lo redirija. ¿Por qué?

https://stackoverflow.com/questions/47427/why-do-some- websites-add-slugs-to-the-end-of-urls

… ¡Vaya, el software de correo electrónico cortó el final de la URL! No hay problema, porque todavía puedes rodar con solo https://stackoverflow.com/questions/47427

El único gran problema con este enfoque es que si obtiene el slug del título de su contenido, ¿cómo va a lidiar con títulos que no son ASCII ni UTF-8?

Básicamente es una ubicación más significativa para el recurso. Usar el ID es perfectamente válido, pero significa más para las máquinas que para las personas.

Estrictamente hablando, la ID no debería ser necesaria si la babosa es única, puede asegurar más fácilmente las babosas únicas al buscar dentro de las fechas.

es decir:

 /2008/sept/06/why-some-websites-add-slugs-end-of-urls/ 

Básicamente esto explota la baja probabilidad de que dos babosas idénticas estén en uso en el mismo día. Si hay un choque, la convención general es agregar un contador al final de la babosa, pero es raro que alguna vez veas esto:

 /2008/sept/06/why-some-websites-add-slugs-end-of-urls/ /2008/sept/06/why-some-websites-add-slugs-end-of-urls-1/ /2008/sept/06/why-some-websites-add-slugs-end-of-urls-2/ 

Muchos algoritmos slug también eliminan palabras comunes como “the” y “a” para ayudar a mantener la URL corta. Este enfoque también facilita la búsqueda de todos los recursos para un día, mes o año determinado: simplemente corta los segmentos.

Además, las URL de stackoverflow son malas en el sentido de que introducen un segmento adicional para mostrar el slug, lo que constituye una violación de la idea de que cada segmento represente una jerarquía de recursos descendente.

La razón por la que la mayoría de los sitios lo usa es probablemente SEO (Optimización de motores de búsqueda). Yahoo solía dar una ponderación razonable a la presencia de la palabra clave de búsqueda en la propia URL, y también ayudó en el resultado de Google.

Más recientemente, los motores de búsqueda han reducido la ponderación dada a las palabras clave en la URL, probablemente porque la técnica ahora es más común en sitios spam que legítima. Las palabras clave en la URL ahora solo tienen un impacto muy leve en los resultados de búsqueda, si es que lo hacen.

En cuanto al stackoverflow en sí mismo, SEO puede ser una motivación (los viejos hábitos se agotan) o simplemente para la usabilidad.

El término slug proviene del periódico / negocio editorial. Es un título corto que se usa para identificar una historia en progreso. Las personas interesadas en la semántica de URL comenzaron a usar un título corto abreviado en sus URL. También vale la pena en terreno SEO, ya que las palabras clave en las URL le dan importancia a una página.

Irónicamente, muchos sitios web han comenzado a colocar una versión completa de los títulos en sus URL con fines de SEO, lo que significa que el término slug ya no se aplica. Esto también irrita a los puristas semánticos, ya que muchas implementaciones simplemente insertan esta versión serializada del título al final de sus URL.

Observo que puedes cambiar el texto libremente. Esta URL parece funcionar igual de bien.

https://stackoverflow.com/questions/47427/why-is-billpg-so-very-awesome

Como ya se dijo, la ‘babosa’ ayuda a las personas y los motores de búsqueda …

Algo que vale la pena notar, es que en la fuente de la página hay una URL canónica

Esto evita que la página se indexe varias veces.

Ejemplo:

  

Elimine el formato de su pregunta y verá parte de la respuesta:

https://stackoverflow.com/questions/47427/

vs

https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

Sin marcado, el segundo es autodescriptivo.

No olvide la legibilidad cuando envíe un enlace, no solo en los motores de búsqueda. Si le envía un correo electrónico a alguien sobre el primer enlace, puede mirar la URL y obtener una idea general de qué se trata. El segundo no da ninguna indicación del contenido de esa página antes de que hagan clic.

Si le enviaste un enlace a alguien por correo electrónico, ¿no tendría más sentido incluir una descripción escribiendo realmente una descripción en lugar de hacer que la otra persona analice la URL donde existe la descripción, y try-to-read-a-bunch-of -hyphenated-words-stuck-together.

En primer lugar, es SEO y fácil de usar, pero en el caso del ejemplo (este sitio), no se hace bien o correctamente (ya que está abierto a trucos de black hat e intoxicación de rango por parte de otros, lo que se reflejaría negativamente en este sitio) .

Si

https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

tiene el contenido, entonces

https://stackoverflow.com/questions/47427/

y

https://stackoverflow.com/questions/47427/any-other-bollix

no debe ser duplicados En realidad, deberían detectar automáticamente que el enlace seguido no usa el texto actual (ya que obviamente el slug está definido por el título de la pregunta y puede editarse posteriormente) y deben redirigir 301 automáticamente a

https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

garantizando así la regla de “una pieza de contenido para un URI”, y si el URI se mueve / cambia, asegúrese de que los marcadores antiguos sigan / avancen a través de 301 redireccionamientos (para que los navegadores inteligentes puedan actualizar los marcadores).

Idealmente, el “slug” debería ser el único identificador necesario. En la práctica, en sitios dynamics como este, debe tener un identificador numérico único o comenzar a agregar / incrementar números al “slug” como lo hace Digg .