按照特定模式从列中提取字符串

按照特定模式从列中提取字符串,第1张

按照特定模式从列中提取字符串

在没有太多背景信息或无法访问您的数据的情况下,我建议遵循以下原则。首先,修改读取数据的代码:

df = pd.read_csv(..., header=None, names=['RegionName']) # add header=False so as to read the first row as data

现在,使用提取状态名称

str.extract
,这仅应提取名称,只要该名称后接子字符串
[edit]”即可。然后,您可以使用来填充所有NaN值
ffill

df['State'] = df['RegionName'].str.extract(    r'(?P<State>.*)(?=s*[edit])').ffill()


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5649565.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存