html文件怎么打开 python_教程

用Python的requests库解决这个问题比较简单，例程如下：

import sys

import requests

reload(sys)

sys.setdefaultencoding('utf-8')

r=requests.get('xxx网址')

fh=open('test.html','w')

fh.write(r.text)

fh.close()

说明一下，requests库不是Python内置的，不过很流行，很多发行版都带，没带的话就去requests官网去下载，或者用 pip install requests命令安装最新版。

如果只是读文件，无所谓了，用open(filename,"r").read()就可以。

不过你应该是想解析内容，建议用beautifulsoap这个库。或者其他能 *** 纵DOM的库，这样检索修改方便。

自然是文件编码的问题，文件读取utf-8格式，建议使用codecs模块,不用安装，直接import就行，使用fp = codecs.open(filename,'r','utf-8')读取utf-8编码文件，python自带的open是默认gbk的。此外，建议文件都使用utf-8格式，gbk实在是windows的遗留问题，utf-8本来可以一统天下，就是windows一直不改，才使得windows下文件编码一直很麻烦。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/tougao/12097035.html

html文件怎么打开 python

发表评论

评论列表（0条）