SyntaxError:非ascii字符'\xe2'在file"

小开

当我在阅读文本文件时遇到类似的问题时，我使用…

f = open('file','rt', errors='ignore')

小开

最佳答案

你会得到一个游离的字节。你可以通过跑步找到它

with open("x.py") as fp:
for i, line in enumerate(fp):
if "\xe2" in line:
print i, repr(line)

你应该用你的程序名替换"x.py"。您将看到行号和有问题的行。例如，在任意插入字节后，我得到:

4 "\xe2        lb = conn.create_load_balancer('my_lb', ['us-east-1a', 'us-east-1b'],[(80, 8080, 'http'), (443, 8443, 'tcp')])\n"

小开

如果你只是想使用UTF-8字符，或者不关心它们是否在你的代码中，将这一行添加到.py文件的顶部

# -*- coding: utf-8 -*-

小开

我得到了这个错误的字符在我的评论(复制/粘贴内容从网络到我的编辑器做笔记的目的)。

在文本牧马人解决:

突出显示文本
进入文本菜单
选择“转换为ASCII”

小开

我在运行下面简单的.py代码时遇到了这个问题:

import sys
print 'version is:', sys.version

DSM的上述代码提供了以下内容:

1 'print \xe2\x80\x98version is\xe2\x80\x99, sys.version'

所以问题是我的文本编辑器使用了SMART QUOTES，就像John Y建议的那样。在更改文本编辑器设置并重新打开/保存文件后，它可以正常工作。

小开

更改文件字符编码，

把下面的行放在你的代码顶部

# -*- coding: utf-8 -*-

小开

我从网上复制粘贴评论时也犯了同样的错误

对我来说，它是单词中的一个引号(')

我只是擦掉，重新打了一遍。

小开

基于PEP 0263——定义Python源代码编码

Python will default to ASCII as standard encoding if no other
encoding hints are given.


To define a source code encoding, a magic comment must
be placed into the source files either as first or second
line in the file, such as:


# coding=<encoding name>


or (using formats recognized by popular editors)


#!/usr/bin/python
# -*- coding: <encoding name> -*-


or


#!/usr/bin/python
# vim: set fileencoding=<encoding name> :

小开

我试图解析那个奇怪的窗口引号和尝试几件事后，这里是工作的代码片段。

def convert_freaking_apostrophe(self,string):


try:
issuer_rename = string.decode('windows-1252')
except:
issuer_rename = string.decode('latin-1')
issuer_rename = issuer_rename.replace(u'’', u"'")
issuer_rename = issuer_rename.encode('ascii','ignore')
try:
os.rename(directory+"/"+issuer,directory+"/"+issuer_rename)
print "Successfully renamed "+issuer+" to "+issuer_rename
return issuer_rename
except:
pass


#HANDLING FOR FUNKY APOSTRAPHE
if re.search(r"([\x90-\xff])", issuer):
issuer = self.convert_freaking_apostrophe(issuer)

小开

在花了大约半小时的时间查看堆栈溢出后，我突然意识到，如果在注释中使用单引号“'”将会通过错误:

SyntaxError: Non-ASCII character '\xe2' in file

在查看traceback后，我能够找到在我的评论中使用的单引号。

小开

\xe2是'-'字符，它出现在一些复制和粘贴中，它使用了不同的等号'-'，导致编码错误。将'-'(来自复制粘贴)替换为正确的'-'(来自键盘按钮)

小开

或者你可以简单地用:

# coding: utf-8

在.py文件的顶部

小开

我有同样的问题，但这是因为我复制粘贴字符串，因为它是。后来，当我手动输入字符串，因为它是错误消失。< / p >

由于-符号导致了错误。当我用手动输入-替换它时，错误就解决了。

复制字符串10 + 3 * 5/(16 − 4)

手动输入字符串10 + 3 * 5/(16 - 4)

你可以清楚地看到这两个连字符之间有一点不同。

我认为这是因为不同的操作系统使用不同的格式，或者可能只是不同的软件。

小开

如果这对任何人都有帮助的话，对我来说，这是因为我试图用python 2.7命令在python 3.4中运行Django实现

小开

对我来说，这个问题是由引号中的“’”符号引起的。由于我从pdf文件中复制了代码，导致了这个错误。我只是把"'"换成了这个"'"。

小开

如果您想找出是什么字符导致了这个问题，只需将有问题的变量赋值给一个字符串，并在iPython控制台中打印它。

对我来说

In [1]: array = [[24.9, 50.5], [11.2, 51.0]]        # Raises an error


In [2]: string = "[[24.9, 50.5], [11.2, 51.0]]"     # Manually paste the above array here


In [3]: string
Out [3]: '[[24.9, 50.5]\xe2\x80\x8b, [11.2, 51.0]]' # Here they are!

小开

对我来说，问题是由于将代码输入Mac Notes，然后从Mac Notes复制并粘贴到我的vim会话中以创建我的文件。这使得我的单引号成为弯曲型。为了解决这个问题，我在vim中打开我的文件，用直引号替换了所有的弯曲单引号，只是删除和重新输入相同的字符。Mac Notes让相同的按键产生弯曲的单引号。

小开

在.py文件的第一行中添加# = utf - 8编码行将解决这个问题。

请在下面的链接中阅读有关问题及其修复的更多信息，在本文中，问题及其解决方案被漂亮地描述:https://www.python.org/dev/peps/pep-0263/

小开

我也有同样的问题，只是把这个添加到我的文件顶部(在Python 3中我没有这个问题，但在Python 2中有

#!/usr/local/bin/python
# coding: latin-1

小开

我很长时间都找不到问题所在，但后来我意识到我从web中复制了一行“UTC-12:00”，其中的连字符/破折号导致了问题。我再写一遍“-”，问题就解决了。

有时候复制粘贴行也会出错。在这种情况下，只需重写复制粘贴的代码，它就可以工作。在重写时，它看起来像什么都没有改变，但错误将会消失。

小开

我的case \xe2是’，应该由'代替。

一般来说，我建议使用例如https://onlineasciitools.com/convert-utf8-to-ascii将UTF-8转换为ASCII

但是如果你想保持UTF-8，你可以使用

#-*- mode: python -*-
# -*- coding: utf-8 -*-

小开

这里有很多好的解决方案。

其中没有真正解决的一个挑战是如何从视觉上识别某些难以识别的与其他纯ASCII字符相似的非ASCII字符。例如，破折号看起来几乎完全像连字符，大括号看起来很像直引号，这取决于文本编辑器的字体。

这一行代码应该在Mac或Linux上运行，它将剥离不在ASCII可打印范围内的字符，并并排显示差异:

# assumes Bash shell; for Bourne shell (sh), rearrange as a pipe and
# give '-' as second argument to 'sdiff' instead
sdiff --suppress-common-lines script.py <(tr -cd '\11\12\15\40-\176' <script.py)

字符\11， \12和\15分别是八进制的制表符，换行符和回车符;剩余的范围是可见的ASCII字符。(帽子提示)

从这个SO线程收集到的另一个技巧使用了一个逆字符类，由ASCII可见范围内的任何不组成，并突出显示它:

grep --color '[^ -~]' script.py

对于grep的macOS / BSD版本，这也可以很好地工作。

小开

我用pycharm修复了这个问题。在pycharm的底部可以看到文件编码。我注意到它是UT-8。我把它改成了US-ASCII < / p >