Spark机器学习实战-问题汇总[持续更新]

Spark机器学习实战-问题汇总[持续更新],第1张

系列文章目录
  1. Spark机器学习实战-专栏介绍
  2. Spark机器学习实战-问题汇总[持续更新]
  3. Spark机器学习实战-Spark的安装及使用
  4. Spark机器学习实战-使用Spark进行数据处理和数据转换

文章目录
  • 系列文章目录
  • 前言
  • 问题
    • 问题1:mml.Lightgbm进行fit *** 作的过程中
    • 问题2:from mmlspark.lightgbm import LightGBMClassifier or LightGBMRegressor


前言

主要记录在实战过程中遇到的各种问题及解决方法。

问题 问题1:mml.Lightgbm进行fit *** 作的过程中
  • TypeError: ‘JavaPackage’ object is not callable

  • 解决方法:这类问题一般都是在spark-submit或者spark config阶段未指定正确jar导致的,所有只要在submit或者config里面添加lightgbm对应的jar包即可:

--jars hdfs://yourpath/mmlspark_2.11-0.18.1.jar,hdfs://yourpath/com.microsoft.ml.lightgbm_lightgbmlib-2.2.350.jar
问题2:from mmlspark.lightgbm import LightGBMClassifier or LightGBMRegressor
  • Pyspark ModuleNotFoundError: No module named ‘mmlspark’ or mmlspark.lightgbm._LightGBMRegressor or _LightGBMClassifier
  • 解决方法:这个主要是没有安装好mmlspark的缘故,mmlspark是微软出的基于spark的机器学习库,这个库pip源安装的时候是老版本0.0.11111111,这种版本太老了,需要替换成新版的mmlspark:
    step1: 从链接中下载指定版本的jar包:比如说我们下载mmlspark_2.11的0.18.1版本的jar包
jar包目录

step2: 解压jar包:mmlspark_2.11-0.18.1.jar

step3: 将mmlspark复制到 /yourpath/anaconda3/envs/mes/lib/python3.7/site-packages/

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/794306.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-06
下一篇 2022-05-06

发表评论

登录后才能评论

评论列表(0条)

保存