你好,生活中我们遇到需要转换文件格式的情况还是比较多的,方法也是千百种,但是想要将Word文档转换为HTML网页文件可以试试这个方法。
具体步骤:
第一步,如图,在转换成网页之前word文档,打开后点击其它文件格式-文件转html。
第二步,选择添加文件按钮添加文件或是直接将word文档拖拽至虚线框处。
第三步,选择输出目录中的自定义按钮后点开文件夹,在d出的窗口设置好储存位置。
第四步,点击开始转换,待d出转换完成的提示窗口后可以看到word文档的内容已经转换成HTML网页格式了。
pip install pydocx
from pydocx import PyDocX
html = PyDocX.to_html("test.docx")
f = open("test.html", 'w', encoding="utf-8")
f.write(html)
f.close()
通过网页上传word文档,只接收docx
<form method="post" enctype="multipart/form-data">
<input type="file" name="file" accept="application/vnd.openxmlformats-officedocument.wordprocessingml.document">
</form>
windows下,将doc转为docx
pip3 install pypiwin32
from win32com import client
word = client.Dispatch("Word.Application")
doc = word.Documents.Open("D:\ \ .doc") //绝对路径 doc文件
doc.SaveAs("D:\ \ .docx",16) //保存的docx 文件,绝对路径
doc.Close()
word.Quit()
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)