网站首页 > 资源文章 正文
目前UTF-8已成为国际上使用最广泛的Unicode编码方法,它是一种可变长度的编码,使用1到4字节来表示一个字符。根据字符的复杂性而变,ASCII字符只需1字节,拉丁字母和希腊字母需要2字节,常用的中文字符需要3字节,其他的一些生僻字符需要4字节。
UTF-8的编码规则并不复杂,分为以下两种情况:
·1.对于长度为1字节的字符将最高位设置为0,其余7位设置为 Unicode码点。值得注意的是 ASCII字符在 Unicode字符集中占据了前128个码点,也就是说 UTF-8编码可以向下兼容 ASCII码,这意味着可以使用 UTF-8来解析年代久远的 ASCI码文本。
·2.对于长度为n字节的字符(其中n>1),将首个字节的高n位都设置为1,第n+1位设置为0;从第二个字节开始,将每个字节的高2位都设置为10;其余所有位用于填充字符的 Unicode码点。
猜你喜欢
- 2024-09-11 为什么不要在MySQL中使用UTF-8编码方式
- 2024-09-11 如何修改mysql数据库的默认编码格式为utf-8?
- 2024-09-11 IDEA设置编码为UTF-8(idea设置编码格式)
- 2024-09-11 千万不要在mysql中使用utf8(千万不要在茶水间说老板坏话小说)
- 2024-09-11 文本编码转换方法:如何从UTF8到ANSI批量处理的实例解析
- 2024-09-11 Golang学习 - unicode/utf8 包(golang gbk)
- 2024-09-11 漫画:什么是字符集和编码?ASCII、UTF-8、UTF-16又是什么?
- 2024-09-11 写代码注意了,千万不要在 MySQL 中使用 UTF-8
- 2024-09-11 「漫画」什么是字符集和编码?ASCII、UTF-8、UTF-16又是什么?
- 2024-09-11 在MySQL中你是否使用过"utf8",有没有遇到这样的bug那就要注意了
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- 电脑显示器花屏 (79)
- 403 forbidden (65)
- linux怎么查看系统版本 (54)
- 补码运算 (63)
- 缓存服务器 (61)
- 定时重启 (59)
- plsql developer (73)
- 对话框打开时命令无法执行 (61)
- excel数据透视表 (72)
- oracle认证 (56)
- 网页不能复制 (84)
- photoshop外挂滤镜 (58)
- 网页无法复制粘贴 (55)
- vmware workstation 7 1 3 (78)
- jdk 64位下载 (65)
- phpstudy 2013 (66)
- 卡通形象生成 (55)
- psd模板免费下载 (67)
- shift (58)
- localhost打不开 (58)
- 检测代理服务器设置 (55)
- frequency (66)
- indesign教程 (55)
- 运行命令大全 (61)
- ping exe (64)
本文暂时没有评论,来添加一个吧(●'◡'●)