如何在Python中对查询字符串进行urlencode?

我试图在提交之前对这个字符串进行urlencode。

queryString = 'eventName=' + evt.fields["eventName"] + '&' + 'eventDescription=' + evt.fields["eventDescription"];
975141 次浏览

你需要将你的参数作为映射(字典)或2元组序列传递到urlencode()中,例如:

>>> import urllib
>>> f = { 'eventName' : 'myEvent', 'eventDescription' : 'cool event'}
>>> urllib.urlencode(f)
'eventName=myEvent&eventDescription=cool+event'

Python 3或以上

使用urllib.parse.urlencode

>>> urllib.parse.urlencode(f)
eventName=myEvent&eventDescription=cool+event

请注意,这确实是常用意义上的没有 do url编码(查看输出)。为此使用urllib.parse.quote_plus

python2

您正在寻找的是urllib.quote_plus

safe_string = urllib.quote_plus('string_of_characters_like_these:$#@=?%^Q^$')


#Value: 'string_of_characters_like_these%3A%24%23%40%3D%3F%25%5EQ%5E%24'

python3

在Python 3中,urllib包已被分解为更小的组件。您将使用urllib.parse.quote_plus(注意parse子模块)

import urllib.parse
safe_string = urllib.parse.quote_plus(...)

请注意,urllib.urlencode并不总是奏效。问题是一些服务关心参数的顺序,当你创建字典时,参数的顺序会丢失。对于这种情况,urllib.quote_plus更好,正如Ricky建议的那样。

供将来参考(例如:对于python3)

>>> import urllib.request as req
>>> query = 'eventName=theEvent&eventDescription=testDesc'
>>> req.pathname2url(query)
>>> 'eventName%3DtheEvent%26eventDescription%3DtestDesc'

尝试要求而不是urllib,您不需要使用urlencode!

import requests
requests.get('http://youraddress.com', params=evt.fields)

编辑:

如果您需要有序名称-值对或多个名称值,请像这样设置参数:

params=[('name1','value11'), ('name1','value12'), ('name2','value21'), ...]

而不是使用字典。

背景

  • Python(版本2.7.2)

问题

  • 您想生成一个urlencoded查询字符串。
  • 您有一个包含名称-值对的字典或对象。
  • 您希望能够控制名称-值对的输出顺序。

解决方案

  • urllib.urlencode
  • urllib.quote_plus

陷阱

示例

以下是一个完整的解决方案,包括如何处理一些陷阱。

### ********************
## init python (version 2.7.2 )
import urllib


### ********************
## first setup a dictionary of name-value pairs
dict_name_value_pairs = {
"bravo"   : "True != False",
"alpha"   : "http://www.example.com",
"charlie" : "hello world",
"delta"   : "1234567 !@#$%^&*",
"echo"    : "user@example.com",
}


### ********************
## setup an exact ordering for the name-value pairs
ary_ordered_names = []
ary_ordered_names.append('alpha')
ary_ordered_names.append('bravo')
ary_ordered_names.append('charlie')
ary_ordered_names.append('delta')
ary_ordered_names.append('echo')


### ********************
## show the output results
if('NO we DO NOT care about the ordering of name-value pairs'):
queryString  = urllib.urlencode(dict_name_value_pairs)
print queryString
"""
echo=user%40example.com&bravo=True+%21%3D+False&delta=1234567+%21%40%23%24%25%5E%26%2A&charlie=hello+world&alpha=http%3A%2F%2Fwww.example.com
"""


if('YES we DO care about the ordering of name-value pairs'):
queryString  = "&".join( [ item+'='+urllib.quote_plus(dict_name_value_pairs[item]) for item in ary_ordered_names ] )
print queryString
"""
alpha=http%3A%2F%2Fwww.example.com&bravo=True+%21%3D+False&charlie=hello+world&delta=1234567+%21%40%23%24%25%5E%26%2A&echo=user%40example.com
"""

试试这个:

urllib.pathname2url(stringToURLEncode)

urlencode不起作用,因为它只适用于字典。quote_plus没有产生正确的输出。

在Python 3中,这与我一起工作

import urllib


urllib.parse.quote(query)

如果urllib.parse.urlencode()给你错误,然后尝试urllib3模块。

语法如下:

import urllib3
urllib3.request.urlencode({"user" : "john" })

另一件可能没有提到的事情是urllib.urlencode()将在字典中将空值编码为字符串None,而不是将该参数编码为缺席。我不知道这是否通常需要,但不适合我的用例,因此我必须使用quote_plus

对于需要同时支持python 2和3的脚本/程序,六个模块提供了引用和urlencode函数:

>>> from six.moves.urllib.parse import urlencode, quote
>>> data = {'some': 'query', 'for': 'encoding'}
>>> urlencode(data)
'some=query&for=encoding'
>>> url = '/some/url/with spaces and %;!<>&'
>>> quote(url)
'/some/url/with%20spaces%20and%20%25%3B%21%3C%3E%26'

对于Python 3urllib3正常工作,您可以按照其官方文档使用如下:

import urllib3


http = urllib3.PoolManager()
response = http.request(
'GET',
'https://api.prylabs.net/eth/v1alpha1/beacon/attestations',
fields={  # here fields are the query params
'epoch': 1234,
'pageSize': pageSize
}
)
response = attestations.data.decode('UTF-8')
import urllib.parse
query = 'Hellö Wörld@Python'
urllib.parse.quote(query) // returns Hell%C3%B6%20W%C3%B6rld%40Python


如果您不想使用urllib。

https://github.com/wayne931121/Python_URL_Decode

#保留字元的百分號編碼
URL_RFC_3986 = {
"!": "%21", "#": "%23", "$": "%24", "&": "%26", "'": "%27", "(": "%28", ")": "%29", "*": "%2A", "+": "%2B",
",": "%2C", "/": "%2F", ":": "%3A", ";": "%3B", "=": "%3D", "?": "%3F", "@": "%40", "[": "%5B", "]": "%5D",
}


def url_encoder(b):
# https://zh.wikipedia.org/wiki/%E7%99%BE%E5%88%86%E5%8F%B7%E7%BC%96%E7%A0%81
if type(b)==bytes:
b = b.decode(encoding="utf-8") #byte can't insert many utf8 charaters
result = bytearray() #bytearray: rw, bytes: read-only
for i in b:
if i in URL_RFC_3986:
for j in URL_RFC_3986[i]:
result.append(ord(j))
continue
i = bytes(i, encoding="utf-8")
if len(i)==1:
result.append(ord(i))
else:
for c in i:
c = hex(c)[2:].upper()
result.append(ord("%"))
result.append(ord(c[0:1]))
result.append(ord(c[1:2]))
result = result.decode(encoding="ascii")
return result


#print(url_encoder("我好棒==%%0.0:)")) ==> '%E6%88%91%E5%A5%BD%E6%A3%92%3D%3D%%0.0%3A%29'