按照特定模式从列中提取字符串

app流量 • 2022-12-16 • 随笔 • 阅读 20

按照特定模式从列中提取字符串

在没有太多背景信息或无法访问您的数据的情况下，我建议遵循以下原则。首先，修改读取数据的代码：

df = pd.read_csv(..., header=None, names=['RegionName']) # add header=False so as to read the first row as data

现在，使用提取状态名称

str.extract

，这仅应提取名称，只要该名称后接子字符串“
[edit]”即可。然后，您可以使用来填充所有NaN值

ffill

。

df['State'] = df['RegionName'].str.extract(    r'(?P<State>.*)(?=s*[edit])').ffill()

欢迎分享，转载请注明来源：内存溢出

提取名称字符串数据填充

打赏

微信扫一扫

支付宝扫一扫

上一篇 2022-12-16

下一篇 2022-12-16

登录后才能评论