Unicode 标准 15.0 版现已推出,包括核心规范、附件和数据文件。这个版本增加了 4489 个字符,使总数达到 149186 个字符。这些新增内容包括两个新书写系统,总共 161 个书写系统。此外,该版本还有 20 个新的表情符号字符和 4193 个 CJK(中文、日文和韩文)表意文字。
15.0 版中的新书写系统和字符增加了对现代语言组的支持,包括:
- Nag Mundari,一种用于书写 Mundari 的现代文字,Mundari 是一种在印度使用的语言。
- 一个卡纳达语字符,用于在印度书写 Konkani、Awadhi 和 Havyaka Kannada 。
- 卡克托维克数字,由阿拉斯加卡克托维克的伊努皮亚克人设计,用于因纽特语和尤皮克语的计数系统
新增的 20 个新的表情符号(emoji),包括 鹅、长笛、折扇、姜、豌豆、粉色爱心、驴、水母等等。
有关新 emoji 字符的完整列表,请参阅 Unicode 15.0 的表情符号 。
Unicode 15.0 版本的其他符号和添加包括:
- 巴哈伊信仰成员使用的九颗白星
- 天文学家和占星家使用的八种天体符号
- 29 个额外的埃及象形文字格式控件,使埃及学家能够更好地表示文本
对语言和学术工作的支持包括:
- Kawi,一种在东南亚发现的历史文字,用于书写古爪哇语和其他语言
- 阿拉伯语书写系统的三个附加字符,以支持土耳其使用的古兰经标记
- 在手写和印刷文件中发现三个 Khojki 字符
- 十个梵文字符,用于表示铭文和手稿中的吉祥标志
- 马拉雅拉姆语音译中使用的六个拉丁字母
- 音标中使用的 63 个西里尔修饰字母
重要的图表字体更新包括:
- 埃及象形文字的一组更新字形,以及标准化的变化序列以支持文本中的旋转字形
- 改进了统一加拿大土著音节的字形,为运营商和其他语言提供更好的支持
- 一种新的Wancho字体,具有改进和简化的形状
对 CJK (中日韩)块的更新添加:
- 新的 CJK 统一表意文字扩展 H 块中的 4192 个表意文字
- CJK 统一表意文字扩展 C 块中的一个表意文字
以下六个 Unicode 标准附件和技术标准在 15.0 版进行了更新(Unicode 属性和规范决定了文本在计算机和手机上的行为。):
- UAX #9,Unicode 双向算法,修改了 UAX9-C2 中的注释,强调使用更高级别的协议来减轻潜在的源代码欺骗攻击。
- UAX #31,Unicode 标识符和模式语法,为默认标识符的配置文件提供了更多指导,阐明了标识符中默认可忽略代码点的使用,并讨论了 Pattern_White_Space 和编程语言中的双向排序问题之间的关系。
- UAX #38,Unicode Han 数据库,添加了 kAlternateTotalStrokes 属性。将 kCihaiT 属性的类别更改为字典索引,扩展 kKangXi 属性,并添加第 3.0、3.10 和 4.5 节。
- UTS #39,Unicode 安全机制,将零宽度连接符 (ZWJ) 和零宽度非连接符 (ZWNJ) 字符从 Identifier_Status=Allowed 更改为 Identifier_Status=Restricted;因此,默认情况下,通用安全配置文件不再允许它们。
- UAX #45,U-Source Ideographs,在其数据文件中记录了新的表意文字,添加了“ExtH”作为新状态,改进了现有 CJK 统一表意文字块的状态标识符,并添加了第 2.5 节。
- UTS #46,Unicode IDNA 兼容性处理,澄清了 ToASCII 中空标签的边缘情况,并添加了有关新的 IDNA 派生属性数据文件的文档。
Unicode 标准是全球所有现代软件和通信的基础,包括操作系统、浏览器、笔记本电脑和智能手机,以及互联网和 Web(URL、HTML、XML、CSS、JSON 等)。Unicode 标准、其相关标准和数据构成了 CLDR 和 ICU 版本的基础。
更多详情请查看发布公告。