在没有太多背景信息或无法访问您的数据的情况下,我建议遵循以下原则。首先,修改读取数据的代码:
df = pd.read_csv(..., header=None, names=['RegionName']) # add header=False so as to read the first row as data
现在,使用提取状态名称
str.extract,这仅应提取名称,只要该名称后接子字符串“
[edit]”即可。然后,您可以使用来填充所有NaN值
ffill。
df['State'] = df['RegionName'].str.extract( r'(?P<State>.*)(?=s*[edit])').ffill()
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)