如何用python为一个文章打标签

如何用python为一个文章打标签,第1张

所以说你真的就把pandas 当读取数据的工具了吗..

增加了一列is_tobacco 作为你说的标记

filter_query 返回含有这些词的列表 效率有一定提升

其次你可以分割后用 multiprocessing 执行 这个加速起来不止一点半点

import pandas as pd

word = pd.read_table('test.txt', encoding = 'utf-8', names = ['query'])

def signquery(word):

tobacco = [u'烟', u'白沙', u'黄金叶', u'利群', u'南京九五', u'黄鹤楼软', u'黄鹤楼硬', u'娇子', u'钻石荷花', u'玉溪', u'七匹狼尚品', u'七匹狼软灰']

word['is_tobacco'] = word['query'].apply(lambda name:name in tobacco)

return word

def filter_query(word):

tobacco = [u'烟', u'白沙', u'黄金叶', u'利群', u'南京九五', u'黄鹤楼软', u'黄鹤楼硬', u'娇子', u'钻石荷花', u'玉溪', u'七匹狼尚品', u'七匹狼软灰']

return word[word['query'].apply(lambda name:name in tobacco)]['query'].to_dict().values()

result = filter_query(word)

print result

以下是使用Python中的Scikit-learn库实现支持向量机(SVM)模型的数据设置标签代码示例:

from sklearn import svm

# 假设有以下三个样本的数据:

X = [[0, 0], [1, 1], [2, 2]]

y = [0, 1, 1]  # 对应每个数据点的标签,0表示负样本,1表示正样本

# 创建SVM模型

clf = svm.SVC()

# 将数据集(X)和标签(y)作为训练数据来训练模型

clf.fit(X, y)

上述代码中,X是一个二维数组,每个元素都代表一个数据点的特征值,y是一个一维数组,每个元素都代表对应数据点的标签。通过将X和y作为训练数据,可以训练SVM模型并得到分类结果。

最近在学习数据分析,用matplotlit绘制条形图,柱状图老师讲了加标签的方法,但是没有讲横向条形图加数据标签的方法,但是我想到业务场景可能会用到,于是自己写了一个脚本练习一下,用竖向条形图的方法加数据标签,怎么都加不上,百度找到一些解决方法,然后自己改了一下终于解决了这个问题。

重点在这个for循环


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/bake/11636054.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-17
下一篇 2023-05-17

发表评论

登录后才能评论

评论列表(0条)

保存