shell变量读hive结果 shell读取变量行内容

转载

mob6454cc719119 2023-08-28 21:31:32

文章标签 shell变量读hive结果 shell读取文件内容到变量读txt储存成不同数据类型读txt解析成不同数据类型读取txt文档的后两百行 java 文章分类 Hive 大数据

今天带大家一起过一遍scala语言的基础知识，涵盖变量声明、基本数据类型、Range使用和文件读取。

val变量与var变量

Scala有两种类型的变量，一种是val，是不可变的，在声明时就必须被初始化，而且初始化以后就不能再赋值；另一种是var，是可变的，声明的时候需要进行初始化，初始化以后还可以再次对其赋值。

val变量

1scala> val myStr = "Hello World!"2myStr: String = Hello World!

上面第1行代码是我们输入的代码，敲入回车后，Scala解释器会解析我们输入的代码，然后返回执行结果，第2行就是Scala解释器执行后返回的结果，从中我们可以看到，myStr变量的类型是String类型，变量的值是Hello World! 这里需要注意的是，尽管我们在第1行代码的声明中，没有给出myStr是String类型，但是，Scala具有“类型推断”能力，可以自动推断出变量的类型。

当然，我们也可以显式声明变量的类型：

1cala> val myStr2 : String = "Hello World!"2myStr2: String = Hello World!

上面已经声明了一个String类型的不可变的变量，下面我们可以使用该变量，比如要打印出来：

1scala> println(myStr)2Hello World!

上面的第1行代码是我们在scala命令提示符后面输入的代码，第2行是执行结果。因为myStr是val变量，因此，一旦初始化以后，就不能再次赋值，所以，下面我们执行的再次赋值操作会报错：

1scala> myStr = "Hello Scala!"2:27: error: reassignment to val3          myStr = "Hello Scala!"4                          ^

var变量

如果一些变量，需要在初始化以后还要不断修改它的值(比如商品价格)，则需要声明为var变量。
下面我们把myPrice声明为var变量，并且在声明的时候需要进行初始化：

1scala> var myPrice : Double = 9.92myPrice: Double = 9.9然后，我们可以再次对myPrice进行赋值：

1scala> myPrice = 10.62myPrice: Double = 10.6

基本数据类型

Scala的数据类型包括：Byte、Char、Short、Int、Long、Float、Double和Boolean。和Java不同的是，在Scala中，这些类型都是“类”，并且都是包scala的成员，比如，Int的全名是scala.Int。对于字符串，Scala用java.lang.String类来表示字符串。
这里要明确什么是“字面量”？字面量包括整数字面量、浮点数字面量、布尔型字面量、字符字面量、字符串字面量、符号字面量、函数字面量和元组字面量。举例如下：

1val i = 123  //123就是整数字面量2val i = 3.14 //3.14就是浮点数字面量3val i = true //true就是布尔型字面量4val i = 'A' //'A'就是字符字面量5val i = "Hello" //"Hello"就是字符串字面量

Scala允许对“字面量”直接执行方法，比如：

15.toString() //产生字符串"5"2"abc".intersect("bcd")  //输出"bc"

上面的intersect()方法用来输出两个字符串中都存在的字符。

操作符

在Scala中，可以使用加(+)、减(-) 、乘(*) 、除(/) 、余数(%)等操作符，而且，这些操作符就是方法。例如，5 + 3和(5).+(3)是等价的，也就是说：a 方法 b 和a.方法(b)这二者是等价的。前者是后者的简写形式，这里的+是方法名，是Int类中的一个方法。具体代码如下：

1scala> val sum1 = 5 + 3 //实际上调用了 (5).+(3)2sum1: Int = 83scala> val sum2 = (5).+(3) //可以发现，写成方法调用的形式，和上面得到相同的结果4sum2: Int = 8

scala:Range

在执行for循环时，我们经常会用到数值序列，比如，i的值从1循环到5，这时就可以采用Range来实现。Range可以支持创建不同数据类型的数值序列，包括Int、Long、Float、Double、Char、BigInt和BigDecimal等。
在创建Range时，需要给出区间的起点和终点以及步长(默认步长为1)。下面通过几个实例来介绍：
(1)创建一个从1到5的数值序列，包含区间终点5，步长为1

1scala> 1 to 52res0: scala.collection.immutable.Range.Inclusive = Range(1, 2, 3, 4, 5)

(2)创建一个从1到5的数值序列，不包含区间终点5，步长为1

1scala> 1 until 52res1: scala.collection.immutable.Range = Range(1, 2, 3, 4)

(3)创建一个从1到10的数值序列，包含区间终点10，步长为2

1scala> 1 to 10 by 22res2: scala.collection.immutable.Range = Range(1, 3, 5, 7, 9)

(4)创建一个Float类型的数值序列，从0.5f到5.9f，步长为0.8f

1scala> 0.5f to 5.9f by 0.8f2res3: scala.collection.immutable.NumericRange[Float] = NumericRange(0.5, 1.3, 2.1, 2.8999999, 3.6999998, 4.5, 5.3)

读写文件

Scala需要使用java.io.PrintWriter实现把数据写入到文本文件。
假设当前正使用用户名hadoop登录Linux系统，打开Scala解释器进入命令提示符状态后，输入以下代码:

1scala> import java.io.PrintWriter2import java.io.PrintWriter //这行是Scala解释器执行上面语句后返回的结果3scala> val out = new PrintWriter("output.txt")4out: java.io.PrintWriter = java.io.PrintWriter@25641d39  //这行是Scala解释器执行上面语句后返回的结果5scala> for (i  out.close()

上面代码中，new PrintWriter(“output.txt”)中只给出了文件名，并没有给出文件路径，采用相对路径，这时，文件就会被保存到启动Scala REPL时的当前目录下

读取文本文件的行

可以使用Scala.io.Source的getLines方法实现对文件中所有行的读取。

仍然假设当前是用hadoop用户登录了Linux系统，并且使用scala命令启动了Scala解释器，现在，我们要把上面刚生成的、在hadoop用户工作目录下的output.txt文件读取出来，下面给出了完整的读取文件实例代码：

1scala> import scala.io.Source 2import scala.io.Source //这行是Scala解释器执行上面语句后返回的结果 3scala> val inputFile = Source.fromFile("output.txt") 4inputFile: scala.io.BufferedSource = non-empty iterator  //这行是Scala解释器执行上面语句后返回的结果 5scala> val lines = inputFile.getLines //返回的结果是一个迭代器 6lines: Iterator[String] = non-empty iterator  //这行是Scala解释器执行上面语句后返回的结果 7scala> for (line

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。