预习非数值数据的编码方式
非数值数据的类型
一.逻辑值
正常情况下,每个字或其他可寻址单位(字节、半字等)是作为一个整体数据单元看待的。但是,某些时候还需要将一个n位数据看成由n个1位数据组成,每个取值为0或1。例如,有时需要存储一个布尔或二进制数据阵列,阵列中的每项只能取值为1或0;有时可能需要提取一个数据项中的某位进行诸如“置位”或“清零”等操作。当数据以这种方式看待时,就被认为是逻辑数据。因此n位二进制数可表示n个逻辑值。逻辑数据只能参加逻辑运算,并且是按位进行的,如按位“与”、按位“或”、逻辑左移、逻辑右移等。
逻辑数据和数值数据都是一串0/1序列,在形式上无任何差异,需要通过指令的操作码类型来识别它们。
二.西文字符
西文由拉丁字母、数字、标点符号及一些特殊符号所组成,它们统称为字符。所有字符的集合叫做字符集。字符不能直接在计算机内部进行处理,因而也必须对其进行数字化编码,字符集中每一个字符都有一个代码(即二进制编码的0/1序列),构成了该字符集的代码表,简称码表。码表中的代码具有唯一性。
字符主要用于外部设备和计算机之间交换信息。一旦确定了所使用的字符集和编码方法后,计算机内部所表示的二进制代码和外部设备输人、打印和显示的字符之间就有唯一的对应关系。字符集有多种,每个字符集的编码方法也多种多样。目前计算机中使用最广泛的西文字符集及其编码是ASCII码。
三.汉字字符
汉字的输入码
①对每个汉字用相应的按键进行的编码表示就称为汉字的输入码,又称为外码
②汉字的输入码的码元是西文键盘中的某个按键
字符集与汉字内码
①GB2312国标字符集
②汉字输入码与汉字内码、汉字交换码是不同的概念
四.数据的宽度与存储
1.计算机内部任何信息都被表示为二进制编码形式。
2.二进制信息的计量单位是字节(byte),也称为组。
3.字用来表示被处理信息的单位,用来量度各种数据类型的宽度。
4.字长表示进行数据运算、存储和传送的部件的宽度。
五.数据的存储和排列顺序
1.信息在计算机中用二进制编码后,得到的是一串0/1序列,每8位构成的一个字节,不同的数据类型具有不同的字节宽度。
2.最低有效位LSB表示最低位,最高有效位MSB表示最高位。最高位MSB是符号位。
3.计算机中,多字节数据都被放在连续的字节序列中。两种排列的方式:大端和小端
4.大端方式将数据的最高有效字节MSB存放在低地址单元中,将最低有效字节LSB放在高地址单元中。数据的地址就是MSB所在的地址。
5.小端方式将数据最高有效字节MSB存放在高地址汇总,将最低有效字节放在低地址中。数据就是LSB在的地址
六.数据校验码
数据在计算机内部进行计算、存取和传送过程中,由于元器件故障或噪音干扰等原因会出现差错,为了减少和避免这些错误,一方面要从计算机硬件本身的可靠性入手,在电路、电源、布线等各方面采取必要的措施,提高计算机抗干扰能力;另一方面要采取相应的数据检错和校正措施,自动的的发现并纠正错误。
七、海明校验码
1.校验位的位数确定
2.分组方式确定
3.校验位的生成和检错、纠错
八、循环冗余校验码
1.CRC码的检错方法
2.校验位的生成
3.CRC码的纠错

重点:
1.ASCII码表
2.数据的存储和排列方式
3.奇偶校验码