- Spark机器学习实战-专栏介绍
- Spark机器学习实战-问题汇总[持续更新]
- Spark机器学习实战-Spark的安装及使用
- Spark机器学习实战-使用Spark进行数据处理和数据转换
文章目录
- 系列文章目录
- 前言
- 问题
- 问题1:mml.Lightgbm进行fit *** 作的过程中
- 问题2:from mmlspark.lightgbm import LightGBMClassifier or LightGBMRegressor
前言
主要记录在实战过程中遇到的各种问题及解决方法。
问题 问题1:mml.Lightgbm进行fit *** 作的过程中-
TypeError: ‘JavaPackage’ object is not callable
-
解决方法:这类问题一般都是在spark-submit或者spark config阶段未指定正确jar导致的,所有只要在submit或者config里面添加lightgbm对应的jar包即可:
--jars hdfs://yourpath/mmlspark_2.11-0.18.1.jar,hdfs://yourpath/com.microsoft.ml.lightgbm_lightgbmlib-2.2.350.jar
问题2:from mmlspark.lightgbm import LightGBMClassifier or LightGBMRegressor
- Pyspark ModuleNotFoundError: No module named ‘mmlspark’ or mmlspark.lightgbm._LightGBMRegressor or _LightGBMClassifier
- 解决方法:这个主要是没有安装好mmlspark的缘故,mmlspark是微软出的基于spark的机器学习库,这个库pip源安装的时候是老版本0.0.11111111,这种版本太老了,需要替换成新版的mmlspark:
step1: 从链接中下载指定版本的jar包:比如说我们下载mmlspark_2.11的0.18.1版本的jar包
step2: 解压jar包:mmlspark_2.11-0.18.1.jar
step3: 将mmlspark复制到 /yourpath/anaconda3/envs/mes/lib/python3.7/site-packages/
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)