python操作文件open()方法指定文件编码

  今天在写入文件时候遇到了中文乱码的问题。

  问题描述: 字符串转以utf-8编码的字符数组 bytes,然后使用 bytes.decode(utf-8)写入文件中。html指定为utf-8编码,结果页面出现中文乱码。

  出现问题的原因是因为生成的html文件是以gbk编码存储的,代码如下:

# 在 open 方法中指定 encoding=utf-8 生成的test.html文件会以 utf-8编码,否则在我的电脑上会以 gbk 编码 with open(test.html, w, encoding=utf-8) as f:     f.write(bytes.decode(utf-8))

 

  记录一下现在浏览器客户端使用的编码由什么标签指定:

# meta 标签, 且包含 http-equiv=Content-Type  那么content中的charset属性指定浏览器使用的字符集 <meta http-equiv=Content-Type content=text/html;charset=utf-8>