移动丨 编码方式怎么选?这篇文章帮你彻底搞明白!
2025年03月12日丨佚名丨分类: 移动今天在家闲着没事,我就琢磨起这个编码方式的事儿。之前老是听人说什么UTF-8、GBK之类的,感觉挺玄乎,今天就自己动手试试,看看它们到底有啥不一样。
1捣鼓编码方式
我先是找些资料,大概知道这玩意儿就是给电脑看的,让电脑认识各种文字。像咱平时用的汉字,还有那些英文、符号啥的,都得靠编码才能在电脑里显示出来。
我解到,最早的时候,老外们搞个ASCII码,就那些英文字母和常用符号。后来咱们国家也得有自己的编码,就弄GB2312,能显示简体中文。再后来为能显示更多的汉字,包括繁体字啥的,又有GBK。
现在最流行的,应该是UTF-8。这玩意儿挺牛,啥文字都能显示,全世界通用。我平时上网、写代码,基本都用的UTF-8。
实践出真知
光看资料不行,还得自己动手试试。我先是用记事本写几个字,然后保存的时候,选不同的编码方式,看看有啥区别。
- 选ASCII,保存后再打开,汉字全变问号。
- 选GB2312,简体中文能正常显示,繁体字不行。
- 选UTF-8,啥字都能显示,没毛病。
然后,我又试着用Python写几行代码,读取不同编码的文件,看看会不会出错。
# 读取UTF-8编码的文件
with open('test_*', 'r', encoding='utf-8') as f:
content = *()
print(content)
# 读取GBK编码的文件
with open('test_*', 'r', encoding='gbk') as f:
content = *()
print(content)
结果也跟我预想的差不多,用啥编码保存的文件,就得用啥编码去读取,不然就会乱码。
经过这么一番折腾,我对编码方式算是有个大概的解。以后再遇到编码问题,应该不会一脸懵。这玩意儿,说白就是个规则,大家都按这个规则来,就能互相沟通,电脑也能认识咱写的字。
还算是有所收获,以后再遇到编码问题,起码我知道该咋整.
版权声明:本站文章如无特别注明均为原创,转载请以超链接形式注明转自财广经验。