如何在python中检索Office文件的作者?

如何在python中检索Office文件的作者?,第1张

如何在python中检索Office文件作者

由于

docx
文件只是XML压缩文件,因此您只需解压缩docx文件并从XML文件中提取作者信息即可。不太清楚它的存储位置,只是短暂地环顾四周就使我怀疑它存储在
dc:creator
docProps/core.xml

您可以通过以下方式打开docx文件并检索创建者:

import zipfile, lxml.etree# open zipfilezf = zipfile.ZipFile('my_doc.docx')# use lxml to parse the xml file we are interested indoc = lxml.etree.fromstring(zf.read('docProps/core.xml'))# retrieve creatorns={'dc': 'http://purl.org/dc/elements/1.1/'}creator = doc.xpath('//dc:creator', namespaces=ns)[0].text


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5653093.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存