如何在Apache Spark预建版本中添加任何新库，例如spark-csv

用一辈子去忘记 • 2022-12-13 • 随笔 • 阅读 18

在使用spark-csv时，我还必须下载

commons-csv

jar（不确定它是否仍然有用）。这两个罐子都在spark分布文件夹中。

我下载了以下罐子：

wget http://search.maven.org/remotecontent?filepath=org/apache/commons/commons-csv/1.1/commons-csv-1.1.jar -O commons-csv-1.1.jar<br/>

wget http://search.maven.org/remotecontent?filepath=com/databricks/spark-csv_2.10/1.0.0/spark-csv_2.10-1.0.0.jar -O spark-csv_2.10-1.0.0.jar

然后使用以下参数启动python spark shell：

./bin/pyspark --jars "spark-csv_2.10-1.0.0.jar,commons-csv-1.1.jar"

欢迎分享，转载请注明来源：内存溢出

罐子文件下载分布读取

打赏

微信扫一扫

支付宝扫一扫

上一篇 2022-12-13

下一篇 2022-12-13

登录后才能评论