初识Flink-从WorldCount开始
生活随笔
收集整理的這篇文章主要介紹了
初识Flink-从WorldCount开始
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
?
Apache Flink是一個用于分布式流和批處理數據處理的開源平臺。Flink的核心是流數據流引擎,為數據流上的分布式計算提供數據分發,通信和容錯。Flink在流引擎之上構建批處理,覆蓋本機迭代支持,托管內存和程序優化。
?
import org.apache.flink.api.scala.ExecutionEnvironmentobject BatchWordCountScala {def main(args: Array[String]): Unit = {val inputPath = "E:\\data\\file" //存放文件路徑val outPut = "E:\\data\\result" //結果val env = ExecutionEnvironment.getExecutionEnvironmentval text = env.readTextFile(inputPath)//引入隱式轉換import org.apache.flink.api.scala._val counts = text.flatMap(_.toLowerCase.split("\\W+")).filter(_.nonEmpty).map((_,1)).groupBy(0).sum(1)counts.writeAsCsv(outPut,"\n"," ").setParallelism(1)env.execute("batch word count")} }?
轉載于:https://www.cnblogs.com/linkmust/p/10891332.html
總結
以上是生活随笔為你收集整理的初识Flink-从WorldCount开始的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mybatis控制台打印执行的sql语句
- 下一篇: CMDB 理论