show | version | enable_checker |
---|---|---|
step |
1.0 |
true |
- 罗马帝国 分成了东西罗马
- 核心的位置 是 Christ 标志
- xp
- 后来发展成为了十字架
- 核心的位置 是 Christ 标志
- 这个 西里尔字符
- 应该 如何编码呢?🤔
- 1981年苏联做了个 7-bit 的西里尔字符集
- KOI-7
- 相当于ascii
- 西里尔字符 有8-bit的版本 吗?
- 1987年制作了 8-bit 的西里尔字符集
- KOI-8
- 相当于latin-1
- 去掉了$(美元符号)
- 但是字节序 是按照latin的字母顺序
- 而不是 西里尔字符的字母顺序
- 西里尔字符 后来如何了呢?
- 西里尔字符后来落实在
- iso-8859-5
- 其他 各种书写文字 也仿照iso-8859-1方式
- 只都改后一半
- 8859 就这样分出 16 个部分
- 每种拼音文字
都
有 自己的字符集
- 每种拼音文字
- 这些字符集的大小 都是1个字节
- 但是 从128到255号字符
- 彼此 都 不一致
- 比如 阿拉伯语字符集
- 但是不能 同时显示
- 阿拉伯语和希腊语
- 就导致了
- 同一个字节
- 不同编码方式
- 对应不同的字符
- 如果同样一个字节
b"\xa1"
- 在 不同编码字符集下
- 对应的字符 是不同的
- 在iso-8859 这套方案 中
- 同一个字节 通过不同的解码方式
- 可以对应 不同的字符
- 导致面对字节序列的时候
- 不但要知道
- 字节的状态
- 更要知道
- 字节所使用的编码方式
- 不但要知道
- 计算机 在显示文字的时候
- 不但要知道 具体的 字节内容 是什么
- 更要明确 这些字节使用的编码方式 是什么
- 解铃 还需 系铃人
- 否则 就会出现乱码
- 扩展区的
乱
- 反而
稳定
了- 基础区的ascii字符
- 反而
- 26个小写拉丁字母表示
- 稳!
- 7-bit 没有满
- 所以 字节中 还能容纳 其它的字符
- 这样 ascii 就成为 各种编码的基础
- 位置更稳了
- 英文字符 在哪里 都能用
- 就更成了 世界级字符 了
- 满招损 谦受益
- 有之以为利 无之以为用
- 性空才能缘起
- 留白才有意境
- 海纳百川
- 是因为够低
- 当时的环境 是
- 大型机 逐渐没落
- 个人电脑 兴起
- 微软 成为 ibm兼容机时代最大的获利者
- 从dos到windows
- 几乎 一统PC
- iso8859系列 字符集
- 又是 如何被微软落实的 呢?
- 在iso-8859-1的基础上
- 微软实现并扩展了这个标准
- 把灰色区域填充了一些符号
- 微软的window-1252编码
- 支持了 西欧、北欧拉丁字符
- 以牺牲 其他地区字符的方式
- 某种程度 终结了 拼音字符的编码大战
- 可是 世界上的字符
- 除了 拼音字符
- 还有 象形文字
- 而且 数量巨大
- 这次回顾了西里尔字符的编码过程
- KOI-7
- KOI-8
- ISO-8859 系列进行总结
- 字符扩展 ascii 共 16 种
- 由iso组织制定
- 从 iso-8859-1
- 到 iso-8859-16
- 无法 同时显示
- 俄文和法文
- 世界上的字符
- 除了 拼音文字 之外
- 还有 象形文字
- 这个 象形文字 怎么来的呢?🤔
- 如何编码呢?🤔
- 我们下次再说!👋