如何在python中将HTML表转换为数组

售楼软件 • 2022-12-17 • 随笔 • 阅读 35

Pandas可以立即将html中的所有表格提取到数据框列表中，从而使您不必自己解析页面（重新设计轮子）。甲数据帧是一个强大的类型2维阵列的。

我建议继续通过Pandas处理数据，因为它是一个很好的工具，但是如果您愿意，也可以转换为其他格式（列表，字典，csv文件等）。

例

"""Extract all tables from an html file, printing and saving each to csv file."""import pandas as pddf_list = pd.read_html('my_file.html')for i, df in enumerate(df_list):    print df    df.to_csv('table {}.csv'.format(i))

直接从Web而不是从文件获取html内容仅需稍作修改：

import requestshtml = requests.get('my_url').contentdf_list = pd.read_html(html)

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5673719.html

数据文件轮子数组阵列

打赏

微信扫一扫

支付宝扫一扫

售楼软件一级用户组

0 0

ValueError：无法将字符串转换为float：id

上一篇 2022-12-16

熊猫：数事

下一篇 2022-12-16

发表评论

登录后才能评论

如何在python中将HTML表转换为数组

发表评论

评论列表（0条）