'\n'
在直接使用.replace()
对dataframe相关列进行转换时,可能因为转义的问题无法转换成功。网上目前能查到的有教程,有使用.rstrip()
成功解决的,但是仅能处理 ‘\n’
出现在字符串最末端的情况。
于是我自己试了一下,发现可以用 apply函数解决,相当于一行一行遍历数据集里的reviews内容,然后每次对一行进行处理,应用到整个数据集上:
首先从数据集随便取一行,试试能否转换成功
review_vote['review'][0].replace("\n", " ")
成功后用apply函数对整一列进行处理。
先将该列转换成 string类型,不然有些评论只有数字什么的会报错。
review_vote['review'] = review_vote['review'].astype(str)
review_vote['review'] = review_vote['review'].apply(lambda x: x.replace("\n", " "))
类似的用法还可以根据已有数据创建新列:
review_vote['vote'] = review_vote['voted_up'].apply(lambda x: 1 if x is True else 0)
现在这个发文助手限流是什么意思…
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)