Java中数据类型的划分
Java的数据类型可以划分为基本数据类型和引用数据类型两种:
基本数据类型浏览
注意以下内容用到了变量的知识,如果需要请看先看下一小节
整数类型:byte、short、int、long
- Java各整数类型有固定的表数范围和字段长度,不受具体OS的影响,以保 证java程序的可移植性。
- java的整型常量默认为 int 型,声明long型常量须后加‘l’或‘L’.
- java程序中变量通常声明为int型,除非不足以表示较大的数,才使用long
public class Demo01{
public static void main(String[] args){
//定义byte、short、int、long变量
byte num1=123;
short num2=123;
int num3=123;
long num4= 234L;
System.out.println("num1:"+num1);
System.out.println("num2:"+num2);
System.out.println("num3:"+num3);
System.out.println("num4:"+num4);
}
}
错误实例:
public class Demo02{
public static void main(String[] args){
//编译失败: 超出byte范围
byte num1=128;
System.out.println("num1:"+num1);
}
}
※※※注意:定义时不要超过数字的范围
浮点类型:float、double
浮点类型在其他语言中又称为实数类型。
- 与整数类型类似,Java 浮点类型也有固定的表数范围和字段长度,不受具体操作 系统的影响。
- 浮点类型在java中的两种表示方式:
a.十进制数形式:如:5.12 512.0f .512 (必须有小数点)
b.科学计数法形式:如:5.12e2 512E2 100E-2 - float:单精度,尾数可以精确到7位有效数字。很多情况下,精度很难满足需求。
- double:双精度,精度是float的两倍。通常采用此类型。
- Java 的浮点型常量默认为double型,声明float型常量,须后加‘f’或‘F’。
public class Demo03{
public static void main(String[] args){
//编译失败: 默认小数为double类型
//float num1= 12.4;
float num1= 12.4F;
double num2=23.5;
System.out.println("num1:"+num1);
System.out.println("num2:"+num2);
}
}
字符型:char
- char 型数据用来表示通常意义上“字符”(2字节)
- Java中的所有字符都使用Unicode编码,故一个字符可以存储一个字 母,一个汉字,或其他书面语的一个字符。
- 字符型变量的三种表现形式:
a.字符常量是用单引号(‘ ’)括起来的单个字符。例如:char c1 = ‘a’; char c2 = ‘中’; char c3 = ‘9’;
b.Java中还允许使用转义字符‘\’来将其后的字符转变为特殊字符型常量。 例如:char c3 = ‘\n’; // '\n’表示换行符 - c.直接使用 Unicode 值来表示字符型常量:‘\uXXXX’。其中,XXXX代表 一个十六进制整数。如:\u000a 表示 \n
- char类型是可以进行运算的。因为它都对应有Unicode码。
- 实例:
public class Demo04{
public static void main(String[] args){
//编译失败:需要使用单引号
//char ch="a";
//编译失败: 只能编写单个字符
//char ch='ab';
char ch='a';
}
}
ASCII编码表
- 在计算机内部,所有数据都使用二进制表示。每一个二进制位(bit)有 0 和 1 两种状态, 因此 8 个二进制位就可以组合出 256 种状态,这被称为一个字节(byte)。一个字节一 共可以用来表示 256 种不同的状态,每一个状态对应一个符号,就是 256 个符号,从 0000000 到 11111111。
- ASCII码:上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的 关系,做了统一规定。这被称为ASCII码。ASCII码一共规定了128个字符的编码,比如 空格“SPACE”是32(二进制00100000),大写的字母A是65(二进制01000001)。这 128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前 面的1位统一规定为0。
- 缺点:
a. 不能表示所有字符。
b.相同的编码表示的字符不一样:比如,130在法语编码中代表了é,在希伯来语编码中却代表 了字母Gimel ( )
Unicode编码表 - 乱码:世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。因 此,要想打开一个文本文件,就必须知道它的编码方式,否则用错误的编码方式解读, 就会出现乱码。
- Unicode:一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一 无二的编码,使用 Unicode 没有乱码的问题。
- Unicode 的缺点:Unicode 只规定了符号的二进制代码,却没有规定这个二进制代码 应该如何存储:无法区别 Unicode 和 ASCII:计算机无法区分三个字节表示一个符号 还是分别表示三个符号。另外,我们知道,英文字母只用一个字节表示就够了,如果 unicode统一规定,每个符号用三个或四个字节表示,那么每个英文字母前都必然有 二到三个字节是0,这对于存储空间来说是极大的浪费。
UTF-8编码
- UTF-8 是在互联网上使用最广的一种 Unicode 的实现方式。
- UTF-8 是一种变长的编码方式。它可以使用 1-6 个字节表示一个符号,根据不同的符号而变化字节长度。
- UTF-8的编码规则:
a.对于单字节的UTF-8编码,该字节的最高位为0,其余7位用来对字符进行编码(等同于 ASCII码)。
b.对于多字节的UTF-8编码,如果编码包含 n 个字节,那么第一个字节的前 n 位为1,第一 个字节的第 n+1 位为0,该字节的剩余各位用来对字符进行编码。在第一个字节之后的 所有的字节,都是最高两位为"10",其余6位用来对字符进行编码。
布尔类型:boolean
boolean类型数据只允许取值true和false,无null。
a. 不可以使用0或非 0 的整数替代false和true,这点和C语言不同。
b.Java虚拟机中没有任何供boolean值专用的字节码指令,Java语言表达所操作的 boolean值,在编译之后都使用java虚拟机中的int数据类型来代替:true用1表示,false 用0表示
public class Demo05{
public static void main(String[] args){
boolean flag=true;
System.out.println("flag:"+flag);
}
}