前端开发入门到精通的在线学习网站

网站首页 > 资源文章 正文

字符编码-utf-8编码 #知识领航者(utf8汉字编码对照表)

qiguaw 2024-09-11 06:20:41 资源文章 24 ℃ 0 评论

目前UTF-8已成为国际上使用最广泛的Unicode编码方法,它是一种可变长度的编码,使用1到4字节来表示一个字符。根据字符的复杂性而变,ASCII字符只需1字节,拉丁字母和希腊字母需要2字节,常用的中文字符需要3字节,其他的一些生僻字符需要4字节。

UTF-8的编码规则并不复杂,分为以下两种情况:

·1.对于长度为1字节的字符将最高位设置为0,其余7位设置为 Unicode码点。值得注意的是 ASCII字符在 Unicode字符集中占据了前128个码点,也就是说 UTF-8编码可以向下兼容 ASCII码,这意味着可以使用 UTF-8来解析年代久远的 ASCI码文本。

·2.对于长度为n字节的字符(其中n>1),将首个字节的高n位都设置为1,第n+1位设置为0;从第二个字节开始,将每个字节的高2位都设置为10;其余所有位用于填充字符的 Unicode码点。

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表