
你的job类并没有设置outputformat,如需要输出到数据库,需要特定的输出如下:
job.setJarByClass(TextCheckerJob.class)job.setMapperClass(TextMapper.class)
job.setReducerClass(TextReduce.class)
job.setInputFormatClass(TextInputFormat.class)
job.setOutputFormatClass(MysqlDBOutputFormat.class)
job.setMapOutputKeyClass(Text.class)
job.setMapOutputValueClass(Text.class)
job.setOutputKeyClass(Text.class)
job.setOutputValueClass(Text.class)
job.setNumReduceTasks(1)
MysqlDBOutputFormat.setOutput(job, "data_chck_result", new String[] { "tblName", "colName", "wrongValue", "count" })
同时,job初始化之前,你需要把连接数据库的信息写入conf中,如下
conf.set("mapreduce.jdbc.driver.class", clazz)conf.set("mapreduce.jdbc.username", username)
conf.set("mapreduce.jdbc.password", password)
conf.set("mapreduce.jdbc.url", url)
上面的MysqlDBOutputFormat类是我自己重写了,你可以直接使用DBOutputFormat这个类
最近利用空闲时间自己在写一个文件备份工具,因为我磁盘上的很多文件很重要,例如很多PPT和讲义。所以需要经常备份,而且因为这些文件很多,所以需要增量备份。 我尝试用过windows自带的ntbackup工具,但感觉不是很爽。欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)