各语言字符编码

回忆上次内容

  • 上次回顾了 非ascii的拉丁字符编码的进化过程
  • 0-127 是 ascii 的领域
  • 西欧、北欧语言 大多使用 拉丁字符
  • 由iso组织 制定iso-8859-1

[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列_git

  • 北欧原来
  • 不是有自己的卢恩符文系统(Runes)吗?

卢恩文字

  • 曾在下述地区 被真实使用
  • 日德兰半岛
  • 斯堪的纳维亚半岛
  • 不列颠群岛
  • 论文符文 出现在
  • 耶灵石
  • 武器铭文
  • 护身符

[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列_python_02

  • 蓝牙王
  • 统一 挪威、瑞典和丹麦
  • 八字胡王
  • 政府不列颠
  • 克努特大帝
  • 更曾统一北海
  • 为什么 武功赫赫的维京人曾用的 卢恩符文系统
  • 没被留下来 呢?

由来

  • 拉丁字符的基础
  • 罗马帝国的强大
  • 基督教的传播
  • 不列颠和北欧 逐渐都 皈依了基督教

[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列_ci_03

  • 圣经
  • 原文翻译成 拉丁文 并得到广泛传播
  • 使用的是 拉丁字符
  • 君士坦丁大帝 对教会很友善
  • 天主教教宗 根在 西罗马帝国梵蒂冈
  • 欧洲 最先搞活字 印圣经的谷腾堡
  • 字体是 日耳曼地区的BlackLetter
  • 被 阿尔卑斯山以南 佛罗伦萨等地居民
  • 嘲笑为哥特风格
  • Goth 今天 也有野蛮的意思

拉丁语

  • 意大利 自有 罗马传统字体
  • Roman正字
  • Italy斜体
  • 虽然 拉丁字符 人人都用
  • 而且 都是 很常用的字体
  • 但是 今天的拉丁语
  • 得加上一个古字
  • 世界上 使用拉丁语的国家 只有梵蒂冈
  • 位于 罗马西北方 高地之上
  • 拉丁语嫡系
  • 意大利语
  • 拉丁语旁系
  • 西班牙语
  • 葡萄牙语
  • 法语

[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列_git_04

  • 西欧、北欧
  • 最后都用 拉丁字符
  • 但 一个字节 也填满了
  • 南欧、东欧
  • 使用 什么字符 呢?

斯拉夫语族

  • 东斯拉夫语支
  • 俄语
  • 乌克兰语
  • 白俄罗斯语
  • 西斯拉夫语支
  • 波兰语
  • 捷克语
  • 斯洛伐克语
  • 索布语
  • 南斯拉夫语支
  • 保加利亚语
  • 斯洛文尼亚语
  • 克罗地亚语
  • 马其顿语
  • 塞尔维亚语
  • 黑山语

[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列_git_05

  • 面积很广
  • 斯拉夫语用什么字符呢?

西里尔字符

  • 斯拉夫语族 西斯拉夫语支
  • 索布语
  • 波兰语
  • 捷克语和斯洛伐克语
  • 以拉丁字母书写

[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列_python_06

  • 斯拉夫语族 东斯拉夫语支
  • 俄罗斯语
  • 乌克兰语
  • 卢森尼亚语
  • 白俄罗斯语
  • 保加利亚语
  • 塞尔维亚语
  • 马其顿语等
  • 当地人平常就说这些话
  • 但是想要写下来
  • 就得用书写系统了
  • 使用西里尔字符
  • 什么是西里尔字符呢?

修典

  • 君士坦丁大帝 迁都君士坦丁堡 后
  • 政治中心和宗教中心 分离
  • 最终 东西罗马帝国 分家

[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列_ci_07

  • 东罗马
  • 向 斯拉夫语区传教
  • 派出传教士
  • 当地人
  • 愿意接受宗教文化影响
  • 但担心政治上的影响
  • 需要找到 拉丁字符之外的字符
  • 保持相对独立性

西里尔兄弟

  • 康斯坦丁(后称为西里尔)和美多德兄弟
  • 出生于希腊
  • 接收 东罗马帝国皇帝的指派
  • 在 斯拉夫语地区传教

[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列_python_08

  • 在保加利亚 创建了西里尔字母cyrilice
  • 结合 当地的习惯
  • 撰写了 大摩拉维亚的法典
  • 后来 布道录《基辅文献》 和《布拉格片段》
  • 使用西里尔字符
  • 在 斯拉夫语地区 广泛传播
  • 为 当地民族文学 及 民间的宗教创作
  • 营造了前提
  • 拉丁字符 和 西里尔字符 越走越远
  • 东正教 最终与基督教 分道扬镳

三种字符比较

  • 古希腊的雕塑、哲学、医学等文化
  • 进入了罗马文明
  • 马其顿王国 被罗马帝国征服后
  • 希腊半岛的军事力量
  • 臣服于 意大利半岛

[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列_python_09

  • 西里尔文字 收到 希腊文字影响
  • 文化 也受到 罗马、希腊文化影响

汉语拼音

  • 当时 前苏联 是我国老大哥
  • 就连 外语学的 都是俄语
  • 也曾计划 用西里尔字母 作为汉语拼音字母

[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列_python_10

  • 后来 中苏关系紧张
  • 西里尔拼音方案 搁浅
  • 最后 将拉丁字符 定为 汉语拼音 字符
  • 这 西里尔字符
  • 应该如何编码呢?

总结

  • 罗马帝国 分成了东西罗马
  • 核心的位置 是 Christ 标志
  • xp
  • 后来发展成为了十字架

[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列_python_11

  • 这个 西里尔字符
  • 应该 如何编码呢?🤔