初识PySpark

初识PySpark,第1张

PySpark简介:https://www.codingdict.com/article/8880

安装配置PySpark环境 Windows中
  1. 打开cmd
  2. 输入Python
  3. 找到site-packages目录
import sys 
sys.path
  1. 将Linux中的spark中的python/lib目录下的两个包(pyspark.zip,py4j.zip)拷贝到site-packages目录下
  2. 然后解压两个包,然后的拷贝的压缩包删除掉。



    注:通过py4j,Python程序能够动态的访问Java虚拟机的Java对象,Java程序也可以回调Python的对象。


    pyspark是spark提供的Python写的sparkAPI库。


Linux/Mac中

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/568547.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-09
下一篇 2022-04-09

发表评论

登录后才能评论

评论列表(0条)

保存