前端开发入门到精通的在线学习网站

网站首页 > 资源文章 正文

UTF-8,GBK等常用的编码介绍(utf-8编码和gbk编码)

qiguaw 2024-09-11 06:20:49 资源文章 22 ℃ 0 评论

相信大多数人在开发时都会遇到过乱码的问题吧,有些乱码,问度娘就可以轻易解决,有些则就没有那么好解决,这时候就要头疼了。

下面来介绍一下我们平时经常使用到的编码

ASCII

ASCII想必大家都很熟悉吧,它包含了英文的大小写以及一些特殊的符号,如美元符号等,它采用单字节编码的方式。

ISO8859-1

这是欧洲大多数国家使用的编码,包括德国、法国、意大利等,其实它是ASCII码的扩展,其向下兼容ASCII,采用的也是单字节编码的格式。需要注意的时,在ISO8859-1中并没有加入欧元符号,直到ISO8859-15的出现才加入欧元符号。

GB2312

GB2312是由我国编写的编码格式,用来支持我们国家的语言,一般英文字母、数字等采用单字节的编码格式,汉字等采用两字节的编码格式。需要注意的是,GB2312没有加入繁体字以及一些生僻字,所以值到GBK的出现,才把繁体字和一些生僻字加入,GBK大大的扩展了GB2312。

Euc-kr

Euc-kr是韩国采用的编码,其采用的是两字节的编码格式

UNICODE

每一个国家都有自己的编码,而各个编码又不兼容,就会产生乱码的可能,所以Unicode码就应运而生了,它称为统一码,它把每一个国家的语言统统收集了,这样不同国家的信息交换就不会产生乱码了,其采用两字节的编码格式。

UTF-8

相比大家都对utf-8比较熟悉吧,毕竟,我想大多数人当中文出现乱码时,都会想到这个编码吧。UTF-8是Unicode码的一种实现,其采用可变常字节的编码格式,用1~6个字节来表示各种字符,比如英文等字符使用一个字节的编码格式,汉字采用三个字节的编码格式。

UTF-16

UTF-16也是Unicode码的一种实现,其采用固定字节的编码格式,每两个字节表示一个Unicode字符。

UTF-8与UTF-16的优缺点

UTF-8优点在于比较的灵活,能比较节省空间,缺点是实现起来比较难,效率相对于而言比较低。

UTF-16的优缺点刚好与UTF-8的优缺点反过来。

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表