如何以 csv 格式输出 hadoop 结果

How can i output hadoop result in csv format(如何以 csv 格式输出 hadoop 结果)
本文介绍了如何以 csv 格式输出 hadoop 结果的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着跟版网的小编来一起学习吧!

问题描述

限时送ChatGPT账号..

我需要以 .csv 格式输出我的 hadoop 结果.我将如何做到这一点?我的代码:https://github.com/studhadoop/xml/blob/master/XmlParser11.java

I need to output my hadoop result in .csv format. how will i do this? My code :https://github.com/studhadoop/xml/blob/master/XmlParser11.java

我是否应该在我的代码中简单地包含 csvoutputFormat.我正在使用 mapreduce API

should i simply include csvoutputFormat in my code. I am using mapreduce API

我的工作.sh

bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita Vidyalayam, Karwar_Class 1 B_ENG.xml  /user/root/ala_xmlrpt-outputshell4

bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit


cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv

解决方案

是我失踪了>在猫

cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv

推荐答案

可以使用TextOutputFormat.默认的键/值分隔符是制表符.您可以通过在驱动程序中设置属性mapred.textoutputformat.separatorText"来更改分隔符.

You can use TextOutputFormat. The default key/ value separator is a tab character. You can change the separator by setting the property "mapred.textoutputformat.separatorText" in your driver.

conf.set("mapred.textoutputformat.separatorText", ",");

这篇关于如何以 csv 格式输出 hadoop 结果的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持跟版网!

本站部分内容来源互联网,如果有图片或者内容侵犯了您的权益,请联系我们,我们会在确认后第一时间进行删除!

相关文档推荐

How to send data to COM PORT using JAVA?(如何使用 JAVA 向 COM PORT 发送数据?)
How to make a report page direction to change to quot;rtlquot;?(如何使报表页面方向更改为“rtl?)
Use cyrillic .properties file in eclipse project(在 Eclipse 项目中使用西里尔文 .properties 文件)
Is there any way to detect an RTL language in Java?(有没有办法在 Java 中检测 RTL 语言?)
How to load resource bundle messages from DB in Java?(如何在 Java 中从 DB 加载资源包消息?)
How do I change the default locale settings in Java to make them consistent?(如何更改 Java 中的默认语言环境设置以使其保持一致?)