- 软件大小: 702KB
- 软件语言: 简体中文
- 软件类别: 国产软件 | 转换翻译
- 运行环境: Win9x/2000/XP/2003/Vista
- 授权方式: 免费版
- 软件等级:
- 更新时间: 2010/6/26 8:29:00
- 开 发 商:
软件介绍:
得心应手UTF-8编码转换器 中文&UTF-8互转器
请在下方(↓)输入需要转换的中文
这句话是一个示例,主要用于查看效果!您看完效果后点击“重新开始”即可去除这句话
将以上内容转换为UTF-8 后结果见下
这句话是一个示例,主࢘
1;用于查看效果!您看完
548;果后点击“重新开始”&#
x5373;可去除这句话
ASCII转换成UCS-2,只是在编码前插入一个0×0。用这些编码,会包括一些控制符,比如 或 /,这在UNIX和一些C函数中,将会产生严重错误。因此可以肯定,UCS-2不适合作为Unicode的外部编码。
因此,才诞生了UTF-8。那么UTF-8是如何编码的?又是如何解决UCS-2的问题呢?
例:
E4 BD A0 11100100 10111101 10100000
这是“你”字的UTF-8编码
4F 60 01001111 01100000
这是“你”的Unicode编码
按照UTF-8的编码规则,分解如下:xxxx0100 xx111101 xx100000
把除了x之外的数字拼接在一起,就变成“你”的Unicode编码了。
注意UTF-8的最前面3个1,表示整个UTF-8串是由3个字节构成的。
经过UTF-8编码之后,再也不会出现敏感字符了,因为最高位始终为1。
以下是Unicode和UTF-8之间的转换关系表:
U-00000000 – U-0000007F: 0xxxxxxx
U-00000080 – U-000007FF: 110xxxxx 10xxxxxx
U-00000800 – U-0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx
U-00010000 – U-001FFFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
U-00200000 – U-03FFFFFF: 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
U-04000000 – U-7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
Unicode编码转换到UTF-8,简单的把Unicode字节流套到x中就变成UTF-8了。
关键字: 编码转换器 转换器