groupBy

-def groupBy[K](f: (T) ⇒ K): Map[K, Array[T]]
按条件分组,条件由 f 匹配,返回值是Map类型,每个key对应一个序列,下面代码实现的是,把小于3的数字放到一组,大于3的放到一组,返回Map[String,Array[Int]]

groupBy[K](f: (A) ⇒ K): immutable.Map[K, Repr]

可看出来groupBy的参数是一个 (A) => K 的函数,即有一个输入和一个输出的函数

我们做一个小测试

val z: Map[Int, Seq[String]] = Seq("a", "b", "c", "d").groupBy[Int] { x => 
  x match {
    case "a" => 1
    case "b" => 1
    case _ => 2
  }
}
println(z)
// print: Map(2 -> List(c, d), 1 -> List(a, b))

很明显(A) => K 中A即Seq中的每项,而K为该项对应的key,Scala根据这个函数返回的key,判断那些项是一组的

二元组

val a = List(("a",2),("a",3),("d",333),("c",3),("c",4))
val b = a.groupBy(_._1)
println(b)
结果:
a: List[(String, Int)] = List((a,2), (a,3), (d,333), (c,3), (c,4))
b: scala.collection.immutable.Map[String,List[(String, Int)]] = Map(d -> List((d,333)), a -> List((a,2), (a,3)), c -> List((c,3), (c,4)))
Map(d -> List((d,333)), a -> List((a,2), (a,3)), c -> List((c,3), (c,4)))

只要同key的不同value组成的list
val c = b.mapValues(r => {r.map(r => {r._2})})
println(c)
结果:
c: scala.collection.immutable.Map[String,List[Int]] = Map(d -> List(333), a -> List(2, 3), c -> List(3, 4))
Map(d -> List(333), a -> List(2, 3), c -> List(3, 4))

如果是多元组,先将其变成为二元组

val e = List(("a",1000,2),("a",2222,3),("d",6888,333),("c",13,3),("c",14,4))
val f = e.map(r => {(r._1, (r._2, r._3))})
结果:
f: List[(String, (Int, Int))] = List((a,(1000,2)), (a,(2222,3)), (d,(6888,333)), (c,(13,3)), (c,(14,4)))

暂时没有查询到以多行数据作为key进行聚合的函数方法。

grouped

-def grouped(size: Int): collection.Iterator[Array[T]]
按指定数量分组,每组有 size 数量个元素,返回一个集合

val a = Array(1, 2, 3,4,5)
val b = a.grouped(3).toList
b.foreach((x) => println("第"+(b.indexOf(x)+1)+"组:"+x.mkString(",")))
/**
第1组:1,2,3
第2组:4,5
*/