python操作文件open()方法指定文件编码
今天在写入文件时候遇到了中文乱码的问题。
问题描述: 字符串转以utf-8编码的字符数组 bytes,然后使用 bytes.decode(utf-8)写入文件中。html指定为utf-8编码,结果页面出现中文乱码。
出现问题的原因是因为生成的html文件是以gbk编码存储的,代码如下:
# 在 open 方法中指定 encoding=utf-8 生成的test.html文件会以 utf-8编码,否则在我的电脑上会以 gbk 编码 with open(test.html, w, encoding=utf-8) as f: f.write(bytes.decode(utf-8))
记录一下现在浏览器客户端使用的编码由什么标签指定:
# meta 标签, 且包含 http-equiv=Content-Type 那么content中的charset属性指定浏览器使用的字符集 <meta http-equiv=Content-Type content=text/html;charset=utf-8>