SPARK--wordCount

SPARK--wordCount,第1张

SPARK--wordCount
import org.apache.spark.{SparkConf, SparkContext}

object Stone {

  def main(args: Array[String]): Unit = {

    val conf = new SparkConf().setAppName("stone").setMaster("local")

    val sc = new SparkContext(conf)
      sc.setLogLevel("ERROR")

    val file = sc.textFile("data/person.txt")

    val value = file.flatMap(_.split(" ")).map(x => new Tuple2(x, 1)).reduceByKey((x, y) => {
      x + y
    })

    print("-------------------------")
    value.foreach (x =>println(x))
    print("----------反转---------------")

    value.map(x => {
      (x._2 , 1)
    }).reduceByKey(_+_).foreach(println)


  }

}

hell world

----统计简单文件的词频

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5709183.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存