1.字符编码和字符集
- ANSI编码
不同的国家和地区制定了不同的标准,由此产生了 GB2312、GBK、Big5、Shift_JIS 等各自的编码标准。这些使用 1 至 4 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文Windows操作系统中,ANSI 编码代表 GBK 编码;在日文Windows操作系统中,ANSI 编码代表 Shift_JIS 编码。 - ASCII码
最普通常见的编码集合。可见字符只包含半角的英文字符和数字字符等。只占用一个字节,有效值范围为0~127 - GB2312
是ANSI编码的一种,实现了ASIIC编码上对中午字符的扩充,占用两个字节。不过在该编码下的只能译出中文,其他国家的打开改使用改编码存储的文件可能会出现乱码。 - GBK
GBK即汉字内码扩展规范,K为扩展的汉语拼音中“扩”字的声母。英文全称Chinese Internal Code Specification。GBK编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。占用两个字节。
Unicode
因为世界上存在所有编码方式,所以进行交流时有时会很不方便,这和就促使了Unicode的诞生,Unicode将世界上所有的符号都纳入其中,无论是英文、日文、还是中文等,但是占用四个字节,所以
- UTF-8
可变长编码。对于不同字符存储占用的字节不同,具体实现原理像ipv4地址分级的方法一样。
2.全角和半角
- 全角
全角指一个字符占用两个标准字符位置的状态。汉字字符和规定了全角的英文字符及国标GB2312-80中的图形符号和特殊字符都是全角字符
一般的系统命令是不用全角字符的,只是在作文字处理时才会使用全角字符。 - 半角
半角,即一个字符占用一个标准字符的位置。
3.java实现对数组的排序
- 方法一:使用Arrays.sort()
package test;
import java.util.Arrays;
public class Kit {
public static void main(String[] args) {
int[] arr=new int[]{2,878,89,7,78,78,45,21};
Arrays.sort(arr);
for(int i:arr)
System.out.println(i);
}
}
- 方法二:
自行编写程序或函数实现。
4.java中三种注释形式
//第一种
/*
第三种
*/
/*
*第
*三
*种
*/