- 参数
- penalty(重要)
- tol:float
- slover(重要)
- random_state:int
- n_jobs:int
- l1_ratio:float
- max_iter:int
- 属性
- classes_
- coef_
- intercept_
- n_features_in_
- feature_names_in_
- n_iter_
- 类方法
- decision_function(X)
- densify()
- sparsify()
- fit(X, y[, sample_weight])
- get_params([deep])
- predict(X)(重要)
- predict_proba(X)(重要)
- score(X, y[, sample_weight])(重要)
- set_params(**params)
linear_model.LogisticRegression(penalty='l2', *, dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1, class_weight=None, random_state=None, solver='lbfgs', max_iter=100, multi_class='auto', verbose=0, warm_start=False, n_jobs=None, l1_ratio=None)
参数
penalty(重要)
正则处罚项
可选值 | 描述 |
---|---|
‘none’: | 不使用正则化 |
‘l2’ | L2正则化 |
‘l1’ | L2正则化 |
‘elasticnet’ | 同时使用L1/L2正则化 |
默认:1e-4
对停止迭代的容忍度
slover(重要)模型训练过程中通过迭代进行参数更新,参数的更新保证模型的损失函数值越来越小,当两次迭代后(或者连续几次迭代)损失函数的值没有降低到一个指定的值,我们就认为参数几乎已经达到最优,这个指定的值就是tol
默认值:‘lbfgs’
优化问题的使用的算法
可选值 | 对应的penalty参数 |
---|---|
‘newton-cg’ | [‘l2’, ‘none’] |
‘lbfgs’ | [‘l2’, ‘none’] |
‘liblinear’ | [‘l1’, ‘l2’] |
‘sag’ | [‘l2’, ‘none’] |
‘saga’ | [‘elasticnet’, ‘l1’, ‘l2’, ‘none’] |
注意:
- 'lbfgs’对于小型数据集是个较好的选择,‘sag’ and ‘saga’ 对于大型数据集的优化速度更快
- ‘liblinear’算法不能对多分类问题进行优化,对于多分类问题只能使用其他四种算法
- 'sag’和’saga’优化算法只能够在样本的特征值在大约相似的数量级时快速收敛,可以使用sklearn.preprocessing模块对样本数据进行预处理
- 默认:None
- 当slover=‘sag’,‘saga’,‘liblinear’时,该参数用于打乱数据集
-
默认:None,代表使用1个内核,该参数值为-1时,将会使用全部处理器
-
表示并行分类时使用到的cpu内核数量
-
当使用‘liblinear’优化算法时,不管’multi_class’是否指定值,该参数都将会被忽略
- None,值在(0,1)之间。
- 当l1_ratio=1时相当于penalty=‘L1’,当l1_ratio=0时相当于penalty=‘L2’
- 只当’penalty=‘elasticnet’'时该参数才会生效,表示正则化l1占得比例
默认:100
算法优化时,对参数的更新次数(迭代次数)
ndarray , (n_classes, )
分类器已知的分类标签列表
ndarray , (1, n_features) or (n_classes, n_features)
决策函数中的特征系数
当是一个二分类问题时,该参数的形状是(1,n_features)
ndarray , (1,) or (n_classes,)
n_features_in_int
模型训练时候使用到的特征数量
ndarray of shape (n_features_in_,)
模型训练时使用到的特征名称,仅仅当训练集中的样本含有数据类型为“str”的特征名称
ndarray of shape (n_classes,) or (1, )
模型训练时对于所有类的迭代次数,如果是二分类或多分类,其返回值仅仅包含一个元素。对于’‘liblinear’优化算法,只返回所有类型的迭代次数中最大的那个
对于样本x进行预测,返回预测的信心分数
数据类型 | |
---|---|
返回值 | ndarray , (n_samples,) or (n_samples, n_classes) |
将系数矩阵转换为密集数组格式
数据类型 | 描述 | |
---|---|---|
返回值 | self | 已经拟合过的估计器 |
将系数矩阵转换为稀疏数组格式
数据类型 | 描述 | |
---|---|---|
返回值 | self | 已经拟合过的估计器 |
使用给定的训练集数据x,y训练模型
数据类型 | 描述 | |
---|---|---|
返回值 | self | 已经拟合过的估计器 |
返回估计器的参数
数据类型 | 描述 | |
---|---|---|
返回值 | dict | 参数名称以及其对应值 |
对样本x进行分类
数据类型 | 描述 | |
---|---|---|
参数X | array-like of shape (n_samples, n_features) | 共有n_samples个样本,每个样本有n_features个特征 |
返回值 | y_pred:ndarray , (n_samples,) | 返回每个样本的预测标签 |
估计概率
数据类型 | 描述 | |
---|---|---|
参数X | array-like of shape (n_samples, n_features) | 共有n_samples个样本,每个样本有n_features个特征 |
返回值 | array-like of shape (n_samples, n_classes) | 共有n_samples个样本,因为有n_classes个目标标签,所以该函数返回每个样本被分类为每个标签的概率 |
返回给定的测试数据及标签的平均准确度,即返回评分
参数 | 数据类型 | 描述 |
---|---|---|
X | array-like,(n_samples, n_features) | 共有n_samples个样本,每个样本有n_features个特征 |
Y | array-like,(n_samples,) or (n_samples, n_outputs) | |
sample_weight | array-like ,(n_samples,), default=None | |
返回值 | self | 已经拟合过的估计器 |
设置估计器的参数
参数 | 数据类型 | 描述 |
---|---|---|
**params | dict | 估计器参数 |
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)