本文介绍如何在文本文档或网页的HTML代码中以Unicode编码插入符号和特殊字符。
首先要知道什么是特殊字符?
字符是任何印刷符号,可以是字母,数字,标点符号甚至是空格。最著名的是我们在PC键盘上可用的那些,它们都与ASCII编码系统相对应。ASCII是一种基于英语的字符代码,它于1963年创建,仅包含128个字符,后来又从128个不同的字符添加到254个,以提供限制,这两种语言都可用于其他语言为了表示当前经常使用的其他字符和符号,这就是所谓的扩展ASCII或更正确的ISO-8859。在世界的这一部分,我们使用 GB_2312 字符集是目前最常用的汉字编码标准 。扩展ASCII所实现的改进非常有限,仅254个可用字符不能解决现有的巨大需求,这就是随后出现Unicode编码系统并最终解决该问题的原因。
Unicode字符编码
Unicode标准允许从多种语言和技术准则的文本到死语的经典文本的符号和字符进行编码。标准和字符表的完整说明可在Unicode官方网站找到,该网站上可以按类别搜索并下载任何字符或符号表。Unicode为每个字符或符号(代码点)指定名称和唯一的数字标识符。每个由Unicode联盟注册的规范字符,都有一个十六进制代码,并且对应一个十进制格式的字符。每种的用法将在本页的后面知道。一些示例:
字符 | 十进制代码 | 十六进制代码 |
---|---|---|
✞ | 10014 | 271e |
❀ | 10048 | 2740 |
✰ | 10032 | 2730 |
如何在文本文档中插入Unicode字符和符号?
在Windows中,可以通过两种方式输入对应于该字符的十进制代码来插入字符,方法是使用富文本编辑器(如Word,PowerPoint或纯文本编辑器),在这种情况下,以前可以在注册表中插入十六进制数字。我在下面解释两种方法。
在RTF编辑器中插入字符
在文本文档中插入Unicode字符的最常用,最实用的方法是使用一个称为Rich Edit控件的程序,例如Word,PowerPoint等Office程序以及Wordpad等其他程序,要插入字符,请执行以下操作:
•激活数字键盘。
•在按下ALT键的同时,单击+键,然后键入与该字符相对应的数字,松开ALT键,将显示它们。使用以下示例代码:10048、10032、9760、10112、10113、9819、9788、10053、9742、9988、10152
在纯文本编辑器中插入字符
在诸如记事本之类的纯文本编辑器程序中,必须事先在注册表中创建一个密钥,以使任何代码点都可以输入为十六进制数字。这并不困难,为此请执行以下操作。
•访问以下注册表项:HKEY_CURRENT_USER \ Control Panel \ Input Method
•在其中创建一个新的REG_SZ值,为其命名:EnableHexNumpad,单击两次,并将其值设置为1。
•重新启动计算机。
然后,在文本文件中输入Unicode字符,方法与前面的方法相同:
•激活数字键盘。
•在按下ALT键的同时,单击+键,然后键入与该字符相对应的数字,松开ALT键,将显示它们。
Windows记事本默认情况下以ANSI格式保存更改,以保存已输入的Unicode字符,从“另存为”菜单中选择“ Unicode编码”。
如何在网页的HTML代码中插入Unicode字符和符号?
可以在html代码中插入Unicode字符,以便浏览器在执行页面时代表特殊字符或符号。有三种方法可以在网页上显示Unicode字符。
使用HTML实体或参考插入字符
它仅使用HTML代码中可以使用的252个字符完成。为此,可以使用一些引用该字符的字母来插入它们,并在与号和分号之间使用字母。
例如,欧元符号将表示为: €。
它将显示:€
由于其逻辑上的局限性,它不是当今广泛使用的方法,除非涉及以下四个字符:&,>,<和“。尽管它们属于ASCII编码,但必须使用其HTML实体插入它们,以避免与Web浏览器的错误或冲突 。
插入带有数字参考的字符
这是最常用的方式。在这种情况下,将插入“&”号,后跟数字或井号,字符的十进制代码和分号。
例如,要显示十进制代码为9730的字符,请输入:&#9730;。
它将显示:☂
这样就可以表示所有Unicode字符。
插入具有十六进制参考的字符
此方法与先前的方法非常相似,但是在这种情况下,使用的是十六进制代码。
插入一个&符,后跟数字或英镑符号,字母x,字符的十六进制代码以及最后的分号。
例如,要显示十六进制代码为2740的字符,请插入: &#x2740;。
它将显示:❀
使用JS脚本插入Unicode字符
还有一种使用javascript插入Unicode字符的替代方法,尽管比html代码方法少用也很有用,为此,请按照以下说明进行操作。使用反斜杠,字母u后跟该字符的十六进制代码。
一个示例,使用此javascript页面“ document.write”上的函数来表示十六进制代码为2740的字符,请执行以下操作:
document.write('\u2740')<br />
</script>
它将显示:❀
如何在Microsoft Word文档中插入Unicode字符和符号?
如果您在计算机上安装了流行的Microsoft Word程序,则在文本文档中插入任何Unicode字符将更加容易。为此,您只需要标记文档中要显示符号的确切位置,然后从“插入”菜单中选择“符号”。
将打开一个面板,您可以在其中查看计算机上安装的每种字体包括的所有字符。
只需选择字符并按插入键即可。
显示Unicode字符时的错误和冲突
并非所有Unicode字符都能正确显示,这与始终代表所有Unicode字符的ASCII编码不同,Unicode字符需要包含由插入代码引用的字符的必需字体才能安装在系统上。
Windows默认情况下会安装包含所有最常用图形字符的字体,例如MS Gothic,Verdana,Cambria Math字体和亚洲语言字体,因此通常会正确翻译最常用的符号。
从哪里获得Unicode字符代码?
如上所述,您可以访问Unicode网站,可以按类别进行搜索并下载包含所需字符的表,这些表是PDF文件,因此下载它们并在计算机上查找符号更为实用。其相应的代码。所有表都可以在这里找到。
特殊Unicode字符代码的示例
字符 | 十进制代码 |
---|---|
✞ | 10014 |
❀ | 10048 |
✽ | 10045 |
✾ | 10046 |
✰ | 10032 |
★ | 9733 |
✩ | 10025 |
✪ | 10026 |
➀ | 10112 |
➁ | 10113 |
➂ | 10114 |
➃ | 10115 |
➄ | 10116 |
➅ | 10117 |
➆ | 10118 |
➇ | 10119 |
➈ | 10120 |
➉ | 10121 |
Social Plugin