Skip to content

Latest commit

 

History

History
189 lines (134 loc) · 4.54 KB

117-820483-西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列_1252字符集.sy.md

File metadata and controls

189 lines (134 loc) · 4.54 KB
show version enable_checker
step
1.0
true

各语言字符编码

回忆上次内容

  • 罗马帝国 分成了东西罗马
    • 核心的位置 是 Christ 标志
      • xp
      • 后来发展成为了十字架

图片描述

  • 这个 西里尔字符
    • 应该 如何编码呢?🤔

KOI-7

  • 1981年苏联做了个 7-bit 的西里尔字符集
    • KOI-7
    • 相当于ascii

图片描述

  • 西里尔字符 有8-bit的版本 吗?

KOI-8

  • 1987年制作了 8-bit 的西里尔字符集
    • KOI-8
    • 相当于latin-1

图片描述

  • 去掉了$(美元符号)
    • 但是字节序 是按照latin的字母顺序
    • 而不是 西里尔字符的字母顺序
    • 西里尔字符 后来如何了呢?

欧洲各地字符集

  • 西里尔字符后来落实在
    • iso-8859-5

图片描述

  • 其他 各种书写文字 也仿照iso-8859-1方式
    • 只都改后一半
  • 8859 就这样分出 16 个部分
    • 每种拼音文字 有 自己的字符集

阿拉伯语字符集

  • 这些字符集的大小 都是1个字节
    • 但是 从128到255号字符
    • 彼此 都 不一致

图片描述

  • 比如 阿拉伯语字符集

希腊语 字符集

  • 但是不能 同时显示
    • 阿拉伯语和希腊语

图片描述

  • 就导致了
    • 同一个字节
    • 不同编码方式
    • 对应不同的字符

不同编码解释

  • 如果同样一个字节 b"\xa1"

图片描述

  • 在 不同编码字符集下
    • 对应的字符 是不同的

图片描述

  • 在iso-8859 这套方案 中
    • 同一个字节 通过不同的解码方式
    • 可以对应 不同的字符
  • 导致面对字节序列的时候
    • 不但要知道
      • 字节的状态
    • 更要知道
      • 字节所使用的编码方式

编码方式

  • 计算机 在显示文字的时候
    • 不但要知道 具体的 字节内容 是什么
    • 更要明确 这些字节使用的编码方式 是什么

图片描述

  • 解铃 还需 系铃人
    • 否则 就会出现乱码
  • 扩展区的
    • 反而稳定
      • 基础区的ascii字符

图片描述

  • 26个小写拉丁字母表示
    • 稳!

缘起性空

  • 7-bit 没有满
    • 所以 字节中 还能容纳 其它的字符
    • 这样 ascii 就成为 各种编码的基础
    • 位置更稳了
  • 英文字符 在哪里 都能用
    • 就更成了 世界级字符 了

图片描述

  • 满招损 谦受益
    • 有之以为利 无之以为用
    • 性空才能缘起
    • 留白才有意境
    • 海纳百川
      • 是因为够低

环境

  • 当时的环境 是
    • 大型机 逐渐没落
    • 个人电脑 兴起
  • 微软 成为 ibm兼容机时代最大的获利者
    • 从dos到windows
    • 几乎 一统PC

图片描述

  • iso8859系列 字符集
    • 又是 如何被微软落实的 呢?

选择

  • 在iso-8859-1的基础上

图片描述

  • 微软实现并扩展了这个标准
    • 把灰色区域填充了一些符号

图片描述

  • 微软的window-1252编码
    • 支持了 西欧、北欧拉丁字符
    • 以牺牲 其他地区字符的方式
    • 某种程度 终结了 拼音字符的编码大战
  • 可是 世界上的字符
    • 除了 拼音字符
    • 还有 象形文字
      • 而且 数量巨大

总结

  • 这次回顾了西里尔字符的编码过程
    • KOI-7
    • KOI-8
  • ISO-8859 系列进行总结
    • 字符扩展 ascii 共 16 种
    • 由iso组织制定
      • 从 iso-8859-1
      • 到 iso-8859-16
    • 无法 同时显示
      • 俄文和法文
  • 世界上的字符
    • 除了 拼音文字 之外
    • 还有 象形文字

图片描述

  • 这个 象形文字 怎么来的呢?🤔
    • 如何编码呢?🤔
  • 我们下次再说!👋