追加到末尾时，python utf-8-sig BOM位于文件中间_随笔

追加到末尾时，python utf-8-sig BOM位于文件中间

不，这不是错误；这是完全正常的预期行为。编解码器无法检测到已写入文件的数量。例如，您可以使用它附加到预先创建但为空的
文件中。该文件不是新文件，但也不包含BOM。

然后还有其他用例，其中在流或字节串上使用编解码器（例如，不使用

precs.open()

），根本没有要测试的文件
，或者开发人员始终希望在输出开始时强制执行BOM。

只使用

utf-8-sig

一个新的文件; 编解码器将始终在您使用BOM时将其写出。

如果直接使用文件，则可以自己测试启动情况；使用

utf-8

代替并手动编写BOM，这只是一个编码的U +
FEFF零宽度无中断空格
：

import iowith io.open(filename, 'a', encoding='utf8') as outfh:    if outfh.tell() == 0:        # start of file        outfh.write(u'ufeff')

我用更新的

io.open()

代替

precs.open()

;

io

是为Python 3开发的新I / O框架

precs

，以我的经验，它比处理编码文件更强大。

注意，实际上，UTF-8 BOM几乎是无用的。UTF-8 没有可变的字节序 ，因此只有一个
字节序标记。另一方面，可以用两个不同字节顺序之一写入UTF-16或UTF-32，这就是为什么需要BOM的原因。

Microsoft产品大多使用UTF-8 BOM来自动检测文件的编码（例如，不是旧版代码页之一）。

欢迎分享，转载请注明来源：内存溢出

追加到末尾时，python utf-8-sig BOM位于文件中间