云计算实例——统计程序的实现
6.1 使用说明
Hadoop字处理程序的主对话框,如图6-1所示:
图6-1 Hadoop Test主对话框
主控制窗口主要包括四个大方面,以Tab标签的形式一致排开,包括输入输出目录设置,启动任务标签,查看云计算任务信息标签和控制台信息查看标签。点击对应的标签即可以进入到对应的界面中,进行相关的操作。
6.1.1 输入输出设置对话框
输入设置主要是选择需要进行统计任务的本地文件或者文件夹,用户根据单选按钮的选择可以选择一个文件作为任务的输入也可以选择整个文件夹作为任务的输入。中间的Put按钮是为了将本地的文件复制拷贝到HDFS文件系统上面,只有HDFS上的文件才能够真正的作为云计算任务的输入。输出设置主要是选择一个文件夹作为最后结果文件的输出目录,同样Hadoop云计算最后生成的结果应该是在HDFS 文件系统上面,所以需要进行相关的处理才能够将结果输出到用户选择的本地目录下面。如图6-2所示。
图6-2输入输出主对话框
1. 输入设置
1) 选择文件作为输入
单击file单选按钮,然后点击”…”输入文件按钮出现只能选择文件的文件选择器,用户只要找到需要输入的文件点击确认即可。
图6-3 选择输入文件
2) 选择文件夹作为输入
不选中file单选按钮,然后点击”…”输入文件按钮出现只能选择文件夹的选择器,用户选择需要输入的文件夹,点击确定即可。
图6-4 选择输入的文件夹
2. 复制文件到HDFS系统上面
用户已经选择好输入的文件或文件夹,且Input path中已经显示输入的路径名称。点击Put按钮,程序执行将本地的的文件拷贝复制到HDFS文件系统上,以备云计算任务的使用,出现图6-5所示的消息对话框说明复制文件成功。
图6-5 复制文件
3. 输出设置
只有在用户的输入文件成功的复制到HDFS文件系统上面,用户才能够选择相应的输出路径。用户点击”…”输出路径的选择,选择相应的目录作为最终结果的输出。如图6-6所示。
图6-6 输出路径设置
点击”submit”提交按钮,程序将用户的输出路径设置到程序中。并在用户输出目录中随机生成一个与时间有关的文件夹存放任务最终生成的结果,如图6-7所示。
图6-7 提交设置