Spark学习（三）Scala程序例子

TheBigBlue

2020-01-28

例一：对目录下的单词文件进行单词统计

/word/first.txt： /word/second.txt： /word/third.txt：

Spark学习（三）Scala程序例子

运行结果：

Spark学习（三）Scala程序例子

import java.io.File;
import java.io.PrintWriter;
import scala.io.Source;
import collection.mutable.Map;
import collection.SortedMap;
object WordCount  {
    def  main(args: Array[String]): Unit = {
          var file=new File("/mnt/hgfs/D/Scala程序/word");   //word目录下有多个.txt文件
          var files=file.listFiles;     //把目录下文件全部列出
          var results=Map.empty[String,Int];    //定义空的映射
          for(file<-files){                 //遍历每个单词文件
              val data=Source.fromFile(file);       //将一个单词文件的内容读到data中
              val strs=data.getLines.flatMap{s=>s.split(" ")};   //读取每行后成为一个集合，将集合遍历后对每个元素(每行)执行分割操作，最后将所有单词放在一个集合
              strs.foreach{           //如果映射中存在键为:单词word,则值加1，否则将值设为1；
                  word=>if(results.contains(word))  results(word)+=1  else results(word)=1;
              }
          }
          //results.valuesIterator.reduceLeft((x,y) => if(x > y) x else y);
          results.foreach{       //遍历输出映射
              case(k,v)=>
              println(s"单词:$k\t次数:$v");
              // val inputFile=new PrintWriter("/mnt/hgfs/D/Scala程序/wordcount.txt")
              // inputFile.println(s"单词:$k\t次数:$v");
              // inputFile.close();
          }
    }        
}

例二：

TheBigBlue

0 关注 0 粉丝 0 动态

相关推荐

今天的收获

直接用jar包方便许多。编程似乎在不断完善，没有人知道未来是啥。因为map和reduce不够用。scala编写代码比java精简。sbt相对于scala来说就相当于 maven对java差不多。

zhixingheyitian 2020-06-08

spark集群环境搭建

1.安装jdk参考https://blog.51cto.com/13001751/1980999 2.安装scala下载路径： https://downloads.lightbend.com/scala/2.12.8/scala-2.12.8.tgz

Hhanwen 2020-05-04

Spark集群式安装部署

在master节点上安装配置完成Spark后，将整个spark目录拷贝到其他节点，并在各个节点上更新/etc/profile文件中的环境变量。- 在master节点启动Hadoop集群- 在master节点启动spark [spark-2.4.

飞鸿踏雪0 2020-04-16

Spark集群的搭建

Type in expressions for evaluation. Or try :help.export SCALA_HOME=/opt/soft/scala-2.13.1 #scala的安装目录。export SPARK_WORKER_CORES

kekeromer 2020-04-16

通过阶乘的例子,练习在JavaScript, Scala和ABAP里实现尾递归

Before we start to research tail recursion, let’s first have a look at the normal recursion.Let N = 5, see how new stack frame i

匆匆那些年 10评论 2020-10-15

Scala(八)【面向对象总结】

第二种方法，包名只能在target目录才能看到。val/var 变量:变量类型 = 值。//var定义的变量可以通过_赋予初始值：null、0、false、0.0. 在主构造器中可以定义成员属性。不带val、var: 只能在类中使用。class称之为伴生类

TheBigBlue 2020-07-28

scala 数据结构（四）：列表 List

Scala中的List 和Java List 不一样，在Java中List是一个接口，真正存放数据是ArrayList，而Scala的List可以直接存放数据，就是一个object，默认情况下Scala的List是不可变的，List属于序列Seq。5)如果

shenwenjie 2020-07-07

scala 数据结构（五）：队列 Queue

1）队列是一个有序列表，在底层可以用数组或是链表来实现。2）其输入和输出要遵循先入先出的原则。后存入的要后取出。3）在Scala中，由设计者直接给我们提供队列类型使用。//补充操作符重载...按照队列的算法，会将数据添加到队列的最后。

muhongdi 2020-07-07

scala 数据结构（八）：-map映射操作

在Scala中可以通过map映射操作来解决：。将集合中的每一个元素通过指定功能（函数）映射（转换）成新的结果集合这里其实就是所谓的将函数作为参数传递给另外一个函数,这是函数式编程的特点。def map[B]: HashSet[B] //map函数的签名。1

waitwolf 2020-07-08

scala 数据结构（九）：-filter、化简

上面的问题当然可以使用遍历list方法来解决，这里我们使用scala的化简方式来完成。4) 然后继续和下一个元素运行，将得到的结果继续返回给第一个参数，继续..

yunfenglee 2020-07-08

scala 数据结构（七）：集 Set

集是不重复元素的结合。集不保留顺序，默认是以哈希集实现。Set不可变集合的创建。val set = Set //不可变。2 集 Set-可变集合的元素添加和删除。set02 -= 2 // 操作符形式。set02.remove // 方法的形式，scala

yunfenglee 2020-07-08

scala 数据结构（六）：映射 Map

1) Scala中的Map 和Java类似，也是一个散列表，它存储的内容也是键值对映射，Scala中不可变的Map是有序的，可变的Map是无序的。即创建包含键值对的二元组，和第一种方式等价，只是形式上不同而已。对偶元组就是只含有两个数据的元组。2) 如

kekeromer 2020-07-08

scala 数据结构（一）：数据结构简介

3）Scala默认采用不可变集合，对于几乎所有的集合类，Scala都同时提供了可变和不可变的版本。4）Scala的集合有三大类：序列Seq、集Set、映射Map，所有的集合都扩展自Iterable特质，在Scala中集合有可变和不可变两种类型。1）不可变集

匆匆那些年 2020-07-07

8-哈希表-Scala实现

哈希表又叫散列表，这里用数组和链表实现。//编写一个hash方法。//先计算该no对应的链表。//编写Emplinkedlist，存放的是雇员信息。//将curEmp定位到链表的最后。//使用辅助指针遍历

liqinglin0 2020-07-05

IDEA安装scala搭建项目环境

查看IDEA2019.2对应的Scala插件的版本。加载刚刚放入C:\Program Files\JetBrains\IntelliJ IDEA 2019.2.4\plugins里面的scala-intellij-bin-2019.2.40.jar插件。在

TheBigBlue 2020-07-05

类、对象、基础类型、操作(Scala)

在类定义中，有字段filed和方法method，统称为成员member，通过val和var定义字段指定对象的变量。实例一个类后，会指派一些内存来保存对象的状态图。个人理解对通过地址间映射，有一块内存保存值。对字段声明私有。不加，就是共有public。Sca

kekeromer 2020-06-13

[bug] Scala eclipse：找不到或无法加载主类

解决右键项目 > properties > scala Compiler >勾选Use Project Setting

TheBigBlue 2020-06-06

Scala核心编程_第09章面向对象编程(高级特性)

Scala语言是完全面向对象的语言，所以并没有静态的操作。Scala中伴生对象采用object关键字声明，伴生对象中声明的全是 "静态"内容，可以通过伴生对象名称直接调用。伴生对象对应的类称之为伴生类，伴生对象的名称应该和伴生类名一致。

liqinglin0 2020-06-01

Scala核心编程_第08章面向对象编程(中级补充)--java动态绑定与静态绑定

Java方法调用过程中，Jvm是如何知道调用的是哪个类的方法？Jvm又是如何处理？当子类和父类存在同一个方法时，子类重写父类（接口）方法时，程序在运行时调用的方法时，是调用父类（接口）的方法呢？绑定又分为静态绑定和动态绑定。在Java中，final、pri

liqinglin0 2020-06-01

scala Object

在scala中被object关键字修饰的类有如下特征：。//创建了一个ObjectDemo_02对象。伴生类与伴生对象。* 伴生类和伴生对象一定要在同一个类文件中，并且类名相同。* 伴生类和伴生对象的特点是可以相互访问被private修饰的字段

yunfenglee 2020-05-30

TheBigBlue

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号