第一章 Java 基本语法(一)
1、关键字与保留字
1.1、关键字(keyword)的定义和特点
- 定义:被 Java 语言赋予了特殊含义,用做专门用途的字符串(单词)
- 特点:关键字中所有字母都为小写
- 官方地址:https://docs.oracle.com/javase/tutorial/java/nutsandbolts/_keywords.html
2.2、保留字(reserved word)
Java 保留字:现有 Java 版本尚未使用,但以后版本可能会作为关键字使用。自己命名标识符时要避免使用这些保留字 goto、const
。
2、标识符
2.1、什么是标识符(Identifier)
- Java 对各种变量、方法和类等要素命名时使用的字符序列称为标识符
- 技巧:凡是自己可以起名字的地方都叫标识符。
2.2、定义合法标识符规则【重要】
- 由 26 个英文字母大小写,0-9,_或$ 组成。
- 数字不可以开头。
- 标识符不能包含空格。
- 不可以使用关键字和保留字,但能
包含
关键字和保留字。 - Java 中严格区分大小写,长度无限制。
举例:划红线的地方都不是合法标识符
2.3、Java 中的名称命名规范
Java 中的名称命名规范:
- 包名:多单词组成时所有字母都小写:
xxxyyyzzz
- 类名、接口名:多单词组成时,所有单词的首字母大写:
XxxYyyZzz
- 变量名、方法名:多单词组成时,第一个单词首字母小写,第二个单词开始每个单词首字母大写:
xxxYyyZzz
- 常量名:所有字母都大写,多单词时每个单词用下划线连接:
XXX_YYY_ZZZ
注意点
- 在起名字时,为了提高阅读性,要尽量有意义,“见名知意”。
- java 采用 unicode 字符集,因此标识符也可以使用汉字声明,但是不建议使用。
3、变量
3.1、变量的声明与使用
变量的概念:
- 内存中的一个存储区域。
- 该区域的数据可以在同一类型范围内不断变化。
- 变量是程序中最基本的存储单元,包含变量类型、变量名和存储的值。
变量的作用:
- 用于在内存中保存数据。
使用变量注意:
- Java 中每个变量必须先声明,后使用。
- 使用变量名来访问这块区域的数据。
- 变量的作用域:其定义所在的一对{ }内。
- 变量只有在其作用域内才有效。
- 同一个作用域内,不能定义重名的变量。
声明变量
- 语法:<数据类型> <变量名称>
- 例如:
int var;
变量的赋值
- 语法:<变量名称> = <值>
- 例如:
var = 10;
声明和赋值变量
- 语法:<数据类型><变量名>= <初始化值>
- 例如:
int var = 10;
补充:变量的分类-按声明的位置的不同
- 在方法体外,类体内声明的变量称为成员变量。
- 在方法体内部声明的变量称为局部变量。
注意:二者在初始化值方面的异同:
- 同:都有生命周期。
- 异:局部变量除
形参
外,其他局部变量都需要显式初始化
。而全局变量可以不显示初始化,因为全局变量有默认的初始值
。
3.2、基本数据类型
变量的分类-按数据类型
- 对于每一种数据都定义了明确的具体数据类型(
强类型语言
),在内存中分配了不同大小的内存空间。
3.2.1、整数类型:byte、short、int、long
- Java 各整数类型有固定的表数范围和字段长度,不受具体 OS 的影响,以保证 java 程序的可移植性。
- java 的整型常量默认为 int 型,声明 long 型常量必须在后面加
“ l ” 或 ” L ”
。 - java 程序中变量通常声明为 int 型,除非不足以表示较大的数,才使用 long 型。
类型 | 占用存储空间 | 表数范围 |
byte | 1个字节 = 8bit (位) | -128 ~ 127 |
short | 2个字节 | -2^15 ~ 2^15-1 |
int | 4个字节 | -2^31 ~ 2^31-1 ( 约21亿 ) |
long | 8个字节 | -2^63 ~ 2^63-1 |
-
1MB = 1024KB、1KB = 1024B、1B = 8bit
- bit(位):计算机中的最小存储单位。
- byte(字节):计算机中基本存储单元。
3.2.2、浮点类型:float、double
- 浮点型常量有两种表示形式:
- 十进制数形式:如:
5.12
、512.0f
、.512
(必须有小数点) - 科学计数法形式:如:
5.12e2
、512E2
、100E-2
- float:单精度,尾数可以精确到7位有效数字。很多情况下,精度很难满足需求。
- double:双精度,精度是float的两倍。通常采用此类型。
Java 的浮点型常量默认为
double
型,声明float
型常量,必须在后面添加" f "或" F "
。
类型 | 占用存储空间 | 表数范围 |
单精度float | 4个字节 (32位) | -3.403E38 ~ 3.403E38 |
双精度double | 8个字节 (64位) | -1.798E308 ~ 1.798E308 |
3.2.3、字符类型:char
-
char
型数据用来表示通常意义上的"字符"(2个字节
) - Java中的所有字符都使用Unicode编码,故
一个字符
可以存储一个字母
,一个汉字
,或其他书面语的一个字符
- 字符型变量的三种表现形式:
- 字符常量是用
单引号
( ’ ’ )括起来的单个字符。例如:char c1 = 'a'; char c2= '中'; char c3 = '9';
- Java中还允许使用转义字符’ \ '来将其后的字符转变为特殊字符型常量。 例如:
char c3 = ' \n ';
其中:'\n'
表示换行符。 - 直接使用 Unicode 值来表示字符型常量:
'\uXXXX'
。其中,XXXX
代表一个十六进制整数
。如:’\u000a'
表示 \n
- char类型是可以进行运算的。因为它都有对应的 Unicode 码。
了解:ASCII 码
- 在计算机内部,所有数据都使用二进制表示。每一个二进制位(bit)有0 和1 两种状态,因此8个二进制位就可以组合出256 种状态,这被称为一个字节(byte)。一个字节一共可以用来表示256 种不同的状态,每一个状态对应一个符号,就是256 个符号,从0000000 到11111111。
- ASCII码:上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为ASCII码。ASCII码一共规定了128个字符的编码,比如空格“SPACE”是32(二进制00100000),大写的字母A是65(二进制01000001)。这128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前面的1位统一规定为0。
- 缺点:
- 不能表示所有字符。
- 相同的编码表示的字符不一样:比如,130在法语编码中代表了é,在希伯来语编码中却代表了字母Gimel(ג)。
了解:Unicode 编码
- 乱码:世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。因此,要想打开一个文本文件,就必须知道它的编码方式,否则用错误的编码方式解读,就会出现乱码。
- Unicode:一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码,使用Unicode 没有乱码的问题。
- Unicode 的缺点:Unicode 只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储:无法区别Unicode 和ASCII:计算机无法区分三个字节表示一个符号还是分别表示三个符号。另外,我们知道,英文字母只用一个字节表示就够了,如果unicode统一规定,每个符号用三个或四个字节表示,那么每个英文字母前都必然有二到三个字节是0,这对于存储空间来说是极大的浪费。
了解:UTF-8
- UTF-8 是在互联网上使用最广的一种Unicode 的实现方式。
- UTF-8 是一种变长的编码方式。它可以使用1-6 个字节表示一个符号,根据不同的符号而变化字节长度。
- UTF-8的编码规则:
- 对于单字节的UTF-8编码,该字节的最高位为0,其余7位用来对字符进行编码(等同于ASCII码)。
- 对于多字节的UTF-8编码,如果编码包含n 个字节,那么第一个字节的前n位为1,第一个字节的第n+1 位为0,该字节的剩余各位用来对字符进行编码。在第一个字节之后的所有的字节,都是最高两位为"10",其余6位用来对字符进行编码。
3.3.4、布尔类型:boolean
- boolean 类型用来判断逻辑条件,一般用于程序流程控制:
- if条件控制语句;
- while循环控制语句;
- do-while循环控制语句;
- for循环控制语句;
- boolean类型数据只允许取值
true 和 false
,不能为null
。
- 不可以使用
0 或 非0
的整数替代false和true,这点和C语言不同。 - Java虚拟机中没有任何供boolean值专用的字节码指令,Java语言表达所操作的 boolean值,在
编译之后
都使用java虚拟机中的int数据类型来代替:true用1表示,false 用0表示。———《java虚拟机规范8版》
3.3、基本数据类型转换
- 自动类型转换:容量小的类型自动转换为容量大的数据类型。数据类型按容量大小排序为:
- 有多种类型的数据混合运算时,系统首先自动将所有数据转换成
容量最大
的那种数据类型
,然后再进行计算。 -
byte、short、char
之间不会相互转换,他们三者在计算时首先转换为int
类型。 -
boolean
类型不能与其它数据类型进行运算。 - 当把任何基本数据类型的值和字符串(String)进行连接运算时(
+
),基本数据类型的值将自动转化为字符串(String
)类型。
3.3、字符串类型:String
- String不是基本数据类型,属于
引用数据类型
。 - 使用方式与基本数据类型一致。例如:
String str = “abcd”;
- 一个字符串可以串接另一个字符串,也可以直接串接其他类型的数据。例如:
-
str = str + “xyz”;
-
int n = 100;
-
str = str + n;
String 练习
3.4、强制类型转换
- 自动类型转换的逆过程,将容量大的数据类型转换为容量小的数据类型。使用时要加上强制转换符:
( )
,但可能造成精度降低或溢出,需要格外注意。 - 通常,字符串不能直接转换为基本数据类型,但通过基本数据类型对应的包装类则可以实现把字符串转换成基本数据类型。
- 如:
String a = “43”; int i = Integer.parseInt(a);
- boolean类型不可以转换为其它的数据类型。
强制类型转换的练习(判断是否能通过编译)
4、进制
4.1、进制与进制间的转换
关于进制
- 所有数字在计算机底层都以二进制形式存在。
- 对于整数,有四种表示方式:
- 二进制(binary):0,1 ,满2进1.以
0b
或0B
开头。 - 十进制(decimal):0-9 ,满10进1。
- 八进制(octal):0-7 ,满8进1. 以数字
0
开头表示。 - 十六进制(hex):0-9及A-F,满16进1. 以
0x
或0X
开头表示。此处的A-F不区分大小写。如:0x21AF +1= 0X21B0
4.2、二进制
- Java整数常量默认是int类型,当用二进制定义整数时,二进制默认占32位,其第32位是符号位;当是long类型时,二进制默认占64位,其第64位是符号位。
- 二进制的整数有如下三种形式:
- 原码:直接将一个数值换成二进制数。最高位是符号位
- 负数的反码:是对原码按位取反,只是最高位(符号位)确定为1。
- 负数的补码:其反码加1。计算机以
二进制补码
的形式保存所有的整数。
- 计算机以二进制补码的形式保存所有的整数
- 正数的原码、反码、补码都相同
- 负数的补码是其反码+1
- 原码与反码是帮助推导出补码而存在的!!!
为什么要使用原码、反码、补码表示形式呢 ?
- 计算机辨别“符号位”显然会让计算机的基础电路设计变得十分复杂! 于是人们想出了将符号位也参与运算的方法。
- 我们知道, 根据运算法则减去一个正数等于加上一个负数, 即: 1-1 = 1 + (-1) = 0 , 所以机器可以只有加法而没有减法, 这样计算机运算的设计就更简单了。
4.2.1、原码、反码、补码 计算方法
- 对于正数来讲:原码、反码、补码是相同的:三码合一。
- 计算机底层都是使用二进制表示的数值。
- 计算机底层都是使用的数值的
补码
保存数据的。
4.3、进制间的转化
十进制 -> 二进制
二进制 -> 十进制
二进制 <-> 八进制、十六进制