最佳答案
我需要用空格替换所有非ascii (\x00-\x7F)字符。我很惊讶,这在Python中不是非常容易的,除非我遗漏了什么。下面的函数简单地删除所有非ascii字符:
def remove_non_ascii_1(text):
return ''.join(i for i in text if ord(i)<128)
这一个替换非ascii字符与空格的数量在字符代码点的字节数(即–
字符被替换为3个空格):
def remove_non_ascii_2(text):
return re.sub(r'[^\x00-\x7F]',' ', text)
如何用一个空格替换所有非ascii字符?
的 的 无数 的 类似的 所以 问题, 没有一个 地址 字符 的0 的1 的2 的3 的4, 的5额外地址所有非ascii字符而不是特定字符。