我有问题从一个文件读取,处理其字符串和保存到 UTF-8文件。
密码如下:
try:
filehandle = open(filename,"r")
except:
print("Could not open file " + filename)
quit()
text = filehandle.read()
filehandle.close()
然后对变量 text 进行一些处理。
然后
try:
writer = open(output,"w")
except:
print("Could not open file " + output)
quit()
#data = text.decode("iso 8859-15")
#writer.write(data.encode("UTF-8"))
writer.write(text)
writer.close()
这个输出文件完美,但它这样做的 ISO 8859-15根据我的编辑器。由于同一个编辑器将输入文件(在变量 filename 中)识别为 UTF-8,我不知道为什么会发生这种情况。至于我的研究已经表明,注释行应该解决这个问题。然而,当我使用这些行时,结果文件主要是用特殊字符胡言乱语,文本是用西班牙语的波浪形单词。我真的很感激任何帮助,因为我被难住了... 。