对这段二进制代码分析:第一个字节为10000100,而在utf-8编码规范规定0x80 到 0xBF 范围内的字节,只是跟随字节, 它们本身并不是字符,因此此处把它放到第一个字节处不不合法的。然后对第二个字节进行分析可看出它左边有三个连续的1,这意味着第二个字节和随后的两个字节,(即11100101 10110000 10001111 )共三个字节一起编码为一个字符。同理可分析出后面的三个字节编码为一个字符。
Python字符集编码和文件读写
内容版权声明:除非注明,否则皆为本站原创文章。
转载注明出处:https://www.heiqu.com/d4896e75a257f206f8fb28debf137a9e.html