unicode字符大全

unicode字符大全

Unicode字符编码标准是固定长度的字符编码方案,它包含了世界上几乎所有现用语言的字符。以下是一些常见的Unicode字符及其分类:

一、字母类

  1. 大写字母(Uppercase Letter, Lu)

    • 例如:A、B、C等。
    • 编码示例:U+0041表示大写字母A,U+0042表示大写字母B,以此类推。
  2. 小写字母(Lowercase Letter, Ll)

    • 例如:a、b、c等。
    • 编码示例:U+0061表示小写字母a,U+0062表示小写字母b,以此类推。
  3. 标题字母(Titlecase Letter, Lt)

    • 用于一些特定的标题格式等情况。例如,在某些语言中,单词首字母大写且其余部分小写的特殊形式可能会用到标题字母。

二、数字类

  • 十进制数字(Decimal Digit Number, Nd)

    • 包含0~9这十个数字。
    • 编码示例:U+0030表示数字0,U+0031表示数字1,以此类推直到U+0039表示数字9。

三、标点符号类

  1. 句首标点(Open Punctuation, Po)

    • 例如:左括号(U+0028)、左引号(U+0022或U+201C等不同形式)等,用于标记句子或短语的开始部分。
  2. 句尾标点(Close Punctuation, Pc)

    • 例如:右括号(U+0029)、右引号(U+0022或U+201D等),用于表示相应内容的结束。
  3. 连接标点(Connector Punctuation, Pd)

    • 例如:连字符(U+002D),用于连接单词或单词的部分,如“mother-in-law”中的连字符。

四、符号类

  1. 数学符号(Mathematical Symbol, Sm)

    • 涵盖了众多数学运算符号,如加号(+,U+002B)、减号(-,U+002D,与连接标点中的连字符共用码位但语义不同)、乘号(×,U+00D7)、除号(÷,U+00F7)等,以及各种特殊的数学常量和函数符号等。
  2. 货币符号(Currency Symbol, Sc)

    • 例如:美元符号($,U+0024)、欧元符号(€,U+20AC)、日元符号(¥,U+00A5)等,用于表示不同国家或地区的货币。

五、其他类型

  1. 控制字符(Control, Cc)

    • 这些字符通常不直接显示,而是用于控制文本处理设备或通信协议等。例如换行符(U+000A)、回车符(U+000D)等,在文本格式设置和数据传输中起着关键作用。
  2. 空白字符(Separator, Z)

    • 包括空格(U+0020)、制表符(U+0009)等,用于分隔文本中的单词、段落等,帮助提高文本的可读性和结构清晰度。

由于Unicode字符集非常庞大,包含了世界上几乎所有现用语言的字符,因此无法在此一一列举。如有需要,可以查阅Unicode标准文档或相关网站以获取更全面的信息。