为什么有些网站会在网址后面加上“蛞蝓”?

许多网站,包括这一个,添加什么显然是所谓的 鼻涕虫-描述性,但就我所能告诉无用的文本位-到网址的结尾。

例如,该网站为这个问题提供的 URL 是:

https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

但是下面的网址同样适用:

https://stackoverflow.com/questions/47427/

这篇文章的意义仅仅是为了让 URL 更加用户友好,还是有其他的好处?

44759 次浏览

蛞蝓让 URL 更加友好,你知道当你点击一个链接时会发生什么。搜索引擎,如谷歌,排名较高的网页,如果搜索词在网址。

可用性是一个原因,如果您在电子邮件中收到该链接,您就知道会发生什么。 搜索引擎优化(搜索引擎优化)是另一个原因。搜索引擎,如谷歌将排名您的网页更高的关键字包含在网址

去掉问题的格式,你就会看到部分答案:

https://stackoverflow.com/questions/47427/

https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

没有标记,第二个是自描述性的。

大多数网站使用它的原因可能是搜索引擎优化(搜索引擎优化)。雅虎过去常常给出一个合理的权重,在网址本身的搜索关键字的存在,它也有助于谷歌的结果。

最近,搜索引擎降低了 URL 中关键词的权重,可能是因为这种技术现在在垃圾网站上比合法网站上更常见。URL 中的关键字现在对搜索结果的影响非常小,如果有的话。

至于 stackoverflow 本身,SEO 可能是一个动机(旧习难改)或者仅仅是为了易用性。

不要忘记发送链接时的可读性,而不仅仅是在搜索引擎中。如果你给某人发送了第一个链接,他们可以查看网址并大致了解链接的内容。第二个页面在点击之前没有显示该页面的内容。

如果你发邮件给某人一个链接,通过实际写出一个描述来包含一个描述不是更有意义吗,而不是让对方解析存在描述的 URL,并且尝试阅读一堆带连字符的单词粘在一起。

理想情况下,“蛞蝓”应该是唯一需要的标识符。实际上,在像这样的动态站点上,您要么必须有一个唯一的数字标识符,要么像 Digg 那样开始向“ slug”添加/递增数字。

我注意到你可以自由地更改文本。这个 URL 看起来也很好用。

https://stackoverflow.com/questions/47427/why-is-billpg-so-very-awesome

The term slug comes from the newspaper/publishing business. It's a short title that's used to identify a story in progress. People interested in URL semantics started using a short, abbreviated title in their URLs. It also pays off in SEO land, as keywords in URLs add importance to a page.

具有讽刺意味的是,许多网站已经开始在他们的 URL 中放置一个带连字符的 满了序列化标题版本,严格意义上的 SEO 目的,这意味着术语 slug 不再完全适用。这也让语义纯粹主义者感到恼火,因为许多实现只是在 URL 的末尾添加了这个序列化版本的标题。

It's basically a more meaningful location for the resource. Using the ID is perfectly valid but it means more to machines than people.

严格地说,如果蛞蝓是唯一的,就不需要 ID,通过在日期内确定它们的范围,可以更容易地确保蛞蝓是唯一的。

即:

/2008/sept/06/why-some-websites-add-slugs-end-of-urls/

基本上这是利用了两颗完全相同的子弹在同一天被使用的可能性很低。如果发生冲突,一般的惯例是在子弹的末端加一个计数器,但你很少看到这些:

/2008/sept/06/why-some-websites-add-slugs-end-of-urls/
/2008/sept/06/why-some-websites-add-slugs-end-of-urls-1/
/2008/sept/06/why-some-websites-add-slugs-end-of-urls-2/

许多蛞蝓算法也去掉了“ the”和“ a”这样的常用词,以帮助保持 URL 的简短。这种限定作用域的方法还可以非常简单地查找给定日期、月份或年份的所有资源——只需要删除部分。

此外,堆栈溢出 URL 不好的地方在于,它们为了突出蛞蝓特性而引入了额外的段,这违反了每个段应该表示降序资源层次结构的思想。

First off, it's SEO and user friendly, but in the case of the example (this site), it's not done well or correctly (因为它是开放的黑帽子把戏和排名中毒的其他人,这将反映在这个网站上的恶劣)。

If

https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

有内容,然后

https://stackoverflow.com/questions/47427/

还有

https://stackoverflow.com/questions/47427/any-other-bollix

不应该是重复的。他们实际上应该自动检测到后面的链接没有使用当前文本(因为很明显,slug 是由问题标题定义的,可以稍后编辑) ,他们应该将301自动重定向到

https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

因此确保了“一段内容到一个 URI”规则,如果 URI 移动/更改,确保旧书签在301个重定向中跟随/移动(这样智能浏览器可以更新书签)。

我最近改变了我的网站的网址格式:

Www.mywebsite.com/index.asp?view=display&postid=100

Www.mywebsite.com/this-is-the-title-of-the-post

并注意到文章的点击率在改变后增加了300% 。它当然可以帮助用户决定他们想点击的内容是否与 SEO 目的相关,尽管我不得不说我在改变之后看到的影响很小

我同意其他的反应,任何打错的子弹应该301-重定向到正确的形式。换句话说,https://stackoverflow.com/questions/47427/wh应该重定向到 https://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls。它还有一个没有提到的好处——如果你不重定向到一个规范的 URL,那么你会看到几乎无限多的重复页面。谷歌讨厌重复的内容。

也就是说,您实际上应该只关心内容 ID,并且只要您重定向,就允许该蛞蝓的任何输入。为什么?

网站-add-slug-to-the-end-url

糟糕,邮件软件切断了 URL 的末尾!不过没有问题,因为您仍然可以只使用 https://stackoverflow.com/questions/47427滚动

The one 很大 problem with this approach is if you derive the slug from the title of your content, how are you going to deal with non-ASCII, UTF-8 titles?

如前所述,“蛞蝓”帮助人们和搜索引擎..。

值得注意的是,在页面的源代码中有一个 规范网址

这将防止页多次成为索引。

例如:

<link rel="canonical" href="http://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls">