如何使用 SOLR 管理员删除 SOLR 索引中的所有文档。
我尝试使用网址和它的工作,但想知道是否同样可以做到使用管理员。.
curl http://localhost:8080/solr/update -H "Content-type: text/xml" --data-binary '<delete><query>*:*</query></delete>' curl http://localhost:8080/solr/update -H "Content-type: text/xml" --data-binary '<commit />'
更新: 新版本的 Solr 可能更适合这个答案: https://stackoverflow.com/a/48007194/3692256
我最初的回答如下:
我有一点作弊,但没有手写查询那么多。
因为我以前经历过意外删除的痛苦,所以我尽可能简单明了地删除(在任何类型的数据存储中)。
1)在 Solr Admin Query 屏幕上运行一个查询,只使用左上角的“ q”参数。将范围缩小到实际要删除的项目。对于这个示例,我使用的是 *:*,但是您可以使用诸如 id:abcdef或范围之类的东西。如果您有一个非常复杂的查询,那么您可能会发现多次执行这个查询会更容易,对于希望删除的数据的每个部分都执行一次。
*:*
id:abcdef
2)在搜索结果的顶部,有一个灰色的 URL。如果你把鼠标悬停在它上面,它就会变黑。这是用于获取结果的 URL。右键(上下文)点击它,然后在一个新的选项卡/窗口中打开它。你应该得到这样的东西:
http://localhost:8983/solr/my_core_name/select?q=*%3A*&wt=json&indent=true
现在,我想把它变成删除格式。我用 update?commit=true&stream.body=<delete><query>代替了 select?q=,最后用 </query></delete>代替了 &wt=json&indent=true。
update?commit=true&stream.body=<delete><query>
select?q=
</query></delete>
&wt=json&indent=true
所以我最后说:
http://localhost:8983/solr/my_core_name/update?commit=true&stream.body=<delete><query>*%3A*</query></delete>
深呼吸,为了好运做任何你想做的事情,然后提交网址(输入关键作品)。
现在,您应该能够返回到 Solr 管理页面并运行原始查询并得到零结果。
在 Solr Admin UI 的 文件选项卡中使用以下查询之一:
XML:
<delete><query>*:*</query></delete>
杰森:
{'delete': {'query': '*:*'}}
确保选择 Document Type下拉到 Solr Command (raw XML or JSON)。
Document Type
Solr Command (raw XML or JSON)
此解决方案只适用于删除多个集合中的所有文档,而不是选择性删除:
我有同样的场景,需要删除多个集合中的所有文档。每个碎片中有近50万份文件,每个收藏品中有多个碎片。使用查询更新和删除文件是一项艰巨的任务,因此遵循以下过程:
http://<solrIP>:<port>/solr/admin/collections?action=clusterstatus&wt=json
http://<solr-ip>:<port>/solr/admin/collections?action=BACKUP&name=myBackupName&collection=myCollectionName&location=/path/to/my/shared/drive
http://<solr-ip>:<port>/solr/admin/collections?action=DELETEALIAS&name=collectionname
http://<solr-ip>:<port>/solr/admin/collections?action=CREATE&name=collectionname&numShards=number&replicationFactor=number&maxShardsPerNode=number&collection.configName=configname&router.field=routerfield
I executed the above steps in loop for all the collections and was done in seconds for around 100 collections with huge data. Plus, I had the backups as well for all the collections.
Refer to this for other Solr APIs: DELETEALIAS: Delete a Collection Alias, Input
在集合文档选项卡上选择 XML,并在参数下面更新。
对于那些不喜欢很多单词的人: -)
如果希望按 ID 删除某些文档,可以使用 SolrPOST 工具。
./post -c $core_name ./delete.xml
如果 delete.xml文件包含文档 id:
delete.xml
<delete> <id>a3f04b50-5eea-4e26-a6ac-205397df7957</id> </delete>
在“文档”选项卡下,在“文档类型”下选择“原始 XML 或 JSON”,然后使用每个文档的唯一标识符添加所需的查询。
{'delete': {'query': 'filter(product_id:(25634 25635 25636))'}}