html文件怎么打开 python

html文件怎么打开 python,第1张

用Python的requests库解决这个问题比较简单,例程如下:

import sys

import requests

reload(sys)

sys.setdefaultencoding('utf-8')

r=requests.get('xxx网址')

fh=open('test.html','w')

fh.write(r.text)

fh.close()

说明一下,requests库不是Python内置的,不过很流行,很多发行版都带,没带的话就去requests官网去下载,或者用 pip install requests命令安装最新版。

如果只是读文件,无所谓了,用open(filename,"r").read()就可以。

不过你应该是想解析内容,建议用beautifulsoap这个库。或者其他能 *** 纵DOM的库,这样检索修改方便。

自然是文件编码的问题,文件读取utf-8格式,建议使用codecs模块,不用安装,直接import就行,使用fp = codecs.open(filename,'r','utf-8')读取utf-8编码文件,python自带的open是默认gbk的。此外,建议文件都使用utf-8格式,gbk实在是windows的遗留问题,utf-8本来可以一统天下,就是windows一直不改,才使得windows下文件编码一直很麻烦。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12097035.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存