word.Quit()
from docx2html import convert
import HTMLParser
html_parser = HTMLParser.HTMLParser()
html = convert('G:/T.docx') #使用docx2html模块将docx文件转成html串,随后你想干嘛都行
print html_parser.unescape(html) #这句非常关键,docx2html模块将中文进行了转义,所以要将生成的字符串重新转义回来!
Doc是一种常见办公文件格式,如何在Linux命令行下把Doc转换为Html格式。工具/原料
Linux
Libreoffice
方法/步骤
1确保Linux系统下已经安装了Libreoffice。
2关闭Libreoffice图形界面,切换到要转换的文档所在目录。
3输入转换命令libreoffice --invisible --convert-to html 123.doc把123.doc文件转换为html文件,如果该目录下有多个doc文件全部要转换为html文件则可以使用批量转换命令libreoffice --invisible --convert-to html *.doc实现把该目录下全部doc文件转换为html。
4用浏览器打开生成的html文件进行浏览查看。
想要将Word文档转成HTML网页格式其实特别简单,只需要利用第三方软件就能实现,现在科技越发的发达,这种简单的文件格式转换有很多种解决方法,下面小编就简单的介绍一种利用在线转换器来将Word转成HTML的方法,希望能帮到大家。
一、百度搜索在线转换器,然后找到官方网址点击进入。
二、进入网站首页后点击菜单栏中的“文件格式转换”-“Word转HTML”.
三、然后在此页面选择“点击添加文件”,注意文件大小不可超过5M,如果文件带有密码请及时解除密码再做此 *** 作。
四、添加文件后,点击“开始转换”。
五、转换过程中需要一点时间缓冲,请耐心等候。
六、转换成功后可选择“预览”或者“下载”,注意必须登录后才能进行此 *** 作哦。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)