如何将doc转换成html

如何将doc转换成html,第1张

doc.Close()

word.Quit()

from docx2html import convert

import HTMLParser

html_parser = HTMLParser.HTMLParser()

html = convert('G:/T.docx') #使用docx2html模块将docx文件转成html串,随后你想干嘛都行

print html_parser.unescape(html) #这句非常关键,docx2html模块将中文进行了转义,所以要将生成的字符串重新转义回来!

Doc是一种常见办公文件格式,如何在Linux命令行下把Doc转换为Html格式。

工具/原料

Linux

Libreoffice

方法/步骤

1确保Linux系统下已经安装了Libreoffice。

2关闭Libreoffice图形界面,切换到要转换的文档所在目录。

3输入转换命令libreoffice --invisible --convert-to html 123.doc把123.doc文件转换为html文件,如果该目录下有多个doc文件全部要转换为html文件则可以使用批量转换命令libreoffice --invisible --convert-to html *.doc实现把该目录下全部doc文件转换为html。

4用浏览器打开生成的html文件进行浏览查看。

想要将Word文档转成HTML网页格式其实特别简单,只需要利用第三方软件就能实现,现在科技越发的发达,这种简单的文件格式转换有很多种解决方法,下面小编就简单的介绍一种利用在线转换器来将Word转成HTML的方法,希望能帮到大家。

一、百度搜索在线转换器,然后找到官方网址点击进入。

二、进入网站首页后点击菜单栏中的“文件格式转换”-“Word转HTML”.

三、然后在此页面选择“点击添加文件”,注意文件大小不可超过5M,如果文件带有密码请及时解除密码再做此 *** 作。

四、添加文件后,点击“开始转换”。

五、转换过程中需要一点时间缓冲,请耐心等候。

六、转换成功后可选择“预览”或者“下载”,注意必须登录后才能进行此 *** 作哦。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/6118167.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-15
下一篇 2023-03-15

发表评论

登录后才能评论

评论列表(0条)

保存