从 Solr 管理中删除 Solr 文档

如何使用 SOLR 管理员删除 SOLR 索引中的所有文档。

我尝试使用网址和它的工作,但想知道是否同样可以做到使用管理员。.

125418 次浏览

curl http://localhost:8080/solr/update -H "Content-type: text/xml" --data-binary '<delete><query>*:*</query></delete>'
curl http://localhost:8080/solr/update -H "Content-type: text/xml" --data-binary '<commit />'

更新: 新版本的 Solr 可能更适合这个答案: https://stackoverflow.com/a/48007194/3692256

我最初的回答如下:


我有一点作弊,但没有手写查询那么多。

因为我以前经历过意外删除的痛苦,所以我尽可能简单明了地删除(在任何类型的数据存储中)。

1)在 Solr Admin Query 屏幕上运行一个查询,只使用左上角的“ q”参数。将范围缩小到实际要删除的项目。对于这个示例,我使用的是 *:*,但是您可以使用诸如 id:abcdef或范围之类的东西。如果您有一个非常复杂的查询,那么您可能会发现多次执行这个查询会更容易,对于希望删除的数据的每个部分都执行一次。

2)在搜索结果的顶部,有一个灰色的 URL。如果你把鼠标悬停在它上面,它就会变黑。这是用于获取结果的 URL。右键(上下文)点击它,然后在一个新的选项卡/窗口中打开它。你应该得到这样的东西:

http://localhost:8983/solr/my_core_name/select?q=*%3A*&wt=json&indent=true

现在,我想把它变成删除格式。我用 update?commit=true&stream.body=<delete><query>代替了 select?q=,最后用 </query></delete>代替了 &wt=json&indent=true

所以我最后说:

http://localhost:8983/solr/my_core_name/update?commit=true&stream.body=<delete><query>*%3A*</query></delete>

深呼吸,为了好运做任何你想做的事情,然后提交网址(输入关键作品)。

现在,您应该能够返回到 Solr 管理页面并运行原始查询并得到零结果。

在 Solr Admin UI 的 文件选项卡中使用以下查询之一:

XML:

<delete><query>*:*</query></delete>

杰森:

{'delete': {'query': '*:*'}}

确保选择 Document Type下拉到 Solr Command (raw XML or JSON)

此解决方案只适用于删除多个集合中的所有文档,而不是选择性删除:


我有同样的场景,需要删除多个集合中的所有文档。每个碎片中有近50万份文件,每个收藏品中有多个碎片。使用查询更新和删除文件是一项艰巨的任务,因此遵循以下过程:

  1. 使用 Solr API 获取所有集合的详细信息-
    http://<solrIP>:<port>/solr/admin/collections?action=clusterstatus&wt=json
    
    这将提供诸如集合名称、 numShards、 conigname、 router.field、 maxShards、 plicationFactor 等细节。
  2. 将带有上述详细信息的输出 json 保存在一个文件中,以供将来参考,并使用以下 API 备份了删除文档所需的所有集合:
    http://<solr-ip>:<port>/solr/admin/collections?action=BACKUP&name=myBackupName&collection=myCollectionName&location=/path/to/my/shared/drive
    
  3. Further I deleted all the collections which I need to remove all the documents for using the following:
    http://<solr-ip>:<port>/solr/admin/collections?action=DELETEALIAS&name=collectionname
    
  4. Re-created all the collections using the details in the Step 1 and the following API:
    http://<solr-ip>:<port>/solr/admin/collections?action=CREATE&name=collectionname&numShards=number&replicationFactor=number&maxShardsPerNode=number&collection.configName=configname&router.field=routerfield
    

I executed the above steps in loop for all the collections and was done in seconds for around 100 collections with huge data. Plus, I had the backups as well for all the collections.

Refer to this for other Solr APIs: DELETEALIAS: Delete a Collection Alias, Input

在集合文档选项卡上选择 XML,并在参数下面更新。

<delete><query>*:*</query></delete>

对于那些不喜欢很多单词的人: -)

Solr Admin: remove data from Core

如果希望按 ID 删除某些文档,可以使用 SolrPOST 工具。

./post -c $core_name ./delete.xml

如果 delete.xml文件包含文档 id:

<delete>
<id>a3f04b50-5eea-4e26-a6ac-205397df7957</id>
</delete>

在“文档”选项卡下,在“文档类型”下选择“原始 XML 或 JSON”,然后使用每个文档的唯一标识符添加所需的查询。

{'delete': {'query': 'filter(product_id:(25634 25635 25636))'}}


enter image description here