解析 URL 查询字符串的最佳方法

小开

Parse 模块是您的朋友: https://docs.python.org/3/library/urllib.parse.html

检查 Parse.parse _ qs(解析查询字符串，即通过 GET 发送到服务器的表单数据或通过 POST 发送的表单数据，至少对于非多部分数据)。还有用于解释多部分数据的 CGI 现场存储。

要解析 HTTP 交互的其余部分，请参见 RFC2616，它是 HTTP/1.1协议规范。

小开

下面是一个使用 python3urllib.parse的示例:

from urllib.parse import urlparse, parse_qs
URL='https://someurl.com/with/query_string?i=main&mode=front&sid=12ab&enc=+Hello'
parsed_url = urlparse(URL)
parse_qs(parsed_url.query)

产出:

{'i': ['main'], 'enc': [' Hello '], 'mode': ['front'], 'sid': ['12ab']}

Python2的注意事项: from urlparse import urlparse, parse_qs

看: https://pythonhosted.org/six/#module-six.moves.urllib.parse

小开

如果需要查询字符串中的唯一键，请将 dict()与 parse_qsl()一起使用

import urllib.parse
urllib.parse.urlparse('https://someurl.com/with/query_string?a=1&b=2&b=3').query
a=1&b=2&b=3
urllib.parse.parse_qs('a=1&b=2&b=3');
{'a': ['1'], 'b': ['2','3']}
urllib.parse.parse_qsl('a=1&b=2&b=3')
[('a', '1'), ('b', '2'), ('b', '3')]
dict(urllib.parse.parse_qsl('a=1&b=2&b=3'))
{'a': '1', 'b': '3'}

小开

内置到 python 2.7中

>>> from urlparse import parse_qs
>>> parse_qs("search=quint&tags=python")
{'search': ['quint'], 'tags': ['python']}

小开

只用于一行没有导入的快速原型 CGI 变量，显然不是最好的，但可能是有用的。

agrs = dict(item.split('=') for item in env['QUERY_STRING'].split('&') if item)