现在谷歌网络搜索API已经被弃用了,还有什么替代方案?

谷歌Web搜索API已弃用,并被自定义搜索API取代(参见http://code.google.com/apis/websearch/)。

我想搜索整个网络,但看起来有了新的API,只有自定义网站可以搜索。

有没有一种方法可以通过编程的方式搜索整个网络?我可以从Java程序中使用JSON查询旧的API。

212717 次浏览

你可以像浏览器一样发送它们,然后解析html,这是我一直在做的,即使是像Youtube这样的网站。

文档上面有一个注释:

>注:谷歌Web搜索API有 已正式弃用 2010年11月1日。它将继续 工作根据我们的弃用策略, 但是请求的数量 每天制作的数量是有限的。 因此,我们鼓励您搬到 新的自定义搜索API.

弃用策略表示他们将继续运行API 3年。因此,如果您已经有了一个使用旧API的应用程序,您还不必急于进行更改。如果你正在编写一个新的应用程序,请使用自定义搜索API. c。关于如何在Python中做到这一点,请参阅我的回答在这里,但任何语言的想法都是一样的。

我刚从《普通爬行》上看到这个。

http://www.commoncrawl.org/

也许这就是我们都在寻找的答案!!

是的,谷歌自定义搜索现在已经取代了旧的搜索API,但是可以仍然使用谷歌自定义搜索搜索整个网络,尽管自定义搜索设置的步骤不明显。

创建一个谷歌自定义搜索引擎,搜索整个网络:

  1. 从谷歌自定义搜索主页(http://www.google.com/cse/),单击创建一个自定义搜索引擎。
  2. 为搜索引擎键入名称和描述。
  3. 在“定义您的搜索引擎”下,在“要搜索的站点”框中,输入至少一个有效的URL(现在,只需输入www.anyurl.com即可通过此屏幕。稍后再详细介绍)。
  4. 选择需要的CSE版本并接受服务条款,然后单击“下一步”。选择所需的布局选项,然后单击Next。
  5. 单击Next steps部分下的任何链接以导航到控制面板。
  6. 在左侧菜单的“控制面板”下,单击“基础”。
  7. 在“搜索首选项”部分,选择“搜索整个网络,但强调包含的站点”。
  8. 单击“保存更改”。
  9. 在左侧菜单中,在控制面板下,单击站点。
  10. 删除在初始设置过程中输入的站点。

现在您的自定义搜索引擎将搜索整个网络。

定价

  • 谷歌自定义搜索每天免费提供100个查询。
  • 之后,每1000次查询支付5美元。
  • 每天最多有10,000个查询。

来源:https://developers.google.com/custom-search/json-api/v1/overview#Pricing


  • 搜索质量远远低于正常的谷歌搜索(没有同义词,“智能”等)
  • 谷歌甚至计划完全关闭这项服务。
有一个叫做JFreeWebSearch的免费Java API,它使用了前面提到的Faroo: http://www.ke.tu-darmstadt.de/resources/jfreewebsearch < / p >

Gigablast提供了一个廉价的网络搜索API: http://www.gigablast.com/searchfeed.html

下面是自定义搜索控制面板底部的一个选项:“搜索网站”,你可以选择“搜索整个网络,但强调包含的网站”

自定义搜索控制面板-要搜索的站点

谷歌自定义搜索(正如在排名靠前的答案中所提倡的那样)工作得很好,但与它的竞争对手(下图)或其他谷歌API相比,它非常昂贵。它有一个小的免费层(每天100次查询),每1000次查询的价格非常高,为5美元。

他们提供了升级到网站搜索的选项,价格稍微好一点,但这意味着搜索一个网站(你自己的),所以这真的是很不同的东西——不是升级。

主要的替代方案似乎是:

< p > 必应搜索API < br > https://datamarket.azure.com/dataset/5BA839F1-12CE-4CCE-BF57-A49D98D29A44 < br > 它每月有5000q的免费层,每便士的价格从5个查询开始,并且没有硬性限制 更新:在2016年底,该API被关闭,转而支持其Azure对应的“认知服务必应搜索API” https://azure.microsoft.com/en-us/services/cognitive-services/search/ < / p >

在这里看到的的定价图表,起始为3美元/米1000个交易。除非我遗漏了什么东西,这是相当昂贵的。

< p > 雅虎老板搜索API < br > 更新:于2016年3月31日停产。 http://developer.yahoo.com/boss/search/ < br > 全网搜索的价格从12次查询/便士开始

还有一些我以前没听说过:

http://www.gigablast.com/searchfeed.html

http://www.faroo.com/hp/api/api.html

http://www.commoncrawl.org/

< p > http://www.entireweb.com/search_api/implementation/ < br > [中止-如下所述]

. 在这篇SO文章上有一些关于这些的讨论 [因为跑题而被关闭,现在已经不在了]

你可以从谷歌自定义搜索主页(http://www.google.com/cse/)创建“无处不在”自定义搜索引擎。 在添加新引擎时,您只需单击“高级”。在这里您可以提供Schema.org站点类型。'事情'是最泛型的类型,它覆盖了所有的web。< / p >