博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
hadoop 统计输入的行数的MAP
阅读量:7053 次
发布时间:2019-06-28

本文共 907 字,大约阅读时间需要 3 分钟。

hot3.png

import java.io.IOException;import java.util.regex.Matcher;import java.util.regex.Pattern;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper;public class FilterCidMap2 extends Mapper
 { private long count=0; @Override protected void map(LongWritable key, Text value, Mapper
.Context context) throws IOException, InterruptedException { try {            //取得读取的行数          count=key.get();          //正常逻辑 context.write(new Text(), new LongWritable(1)); } catch (Exception e) { e.printStackTrace(); } } //map 方法调用完后才调用的 @Override protected void cleanup(Mapper
.Context context) throws IOException, InterruptedException { //map清理资源的操作 //在reduce中把linescount取出来就行了 context.write(new Text("linesCount"), new LongWritable(count)); }}

转载于:https://my.oschina.net/chiyong/blog/494120

你可能感兴趣的文章
unity客户端与c++服务器之间的简单通讯_1
查看>>
Python_反射
查看>>
Codeforces-963 D Frequency of String
查看>>
MyBatis-mybatis全局映射文件解析
查看>>
WebApi 跨域解决方案 --CORS
查看>>
MySQL系列详解五: xtrabackup实现完全备份及增量备份详解-技术流ken
查看>>
单独编译Android源代码中的模块
查看>>
manjaro安装mysql5.7
查看>>
记录零散的知识点
查看>>
H5上传图片并使用canvas制作海报
查看>>
springmvc学习笔记
查看>>
LRU算法的设计
查看>>
Java util包中常用的类和方法
查看>>
[R] 之 管理工作空间函数
查看>>
将windows目录共享到linux
查看>>
计算机是如何启动的
查看>>
Python的raw_input语句包含中文,在Windows环境CMD中显示乱码的解决方法
查看>>
HIbernate学习笔记3 之 缓存和 对象的三种状态
查看>>
2015.3.12Arinc424 Tools中SiniArincCls.csParserFile(string sFile)函数正则表达式理解
查看>>
angularjs探秘<三> 控制器controller及angular项目结构
查看>>