由于
docx文件只是XML压缩文件,因此您只需解压缩docx文件并从XML文件中提取作者信息即可。不太清楚它的存储位置,只是短暂地环顾四周就使我怀疑它存储在
dc:creator中
docProps/core.xml。
您可以通过以下方式打开docx文件并检索创建者:
import zipfile, lxml.etree# open zipfilezf = zipfile.ZipFile('my_doc.docx')# use lxml to parse the xml file we are interested indoc = lxml.etree.fromstring(zf.read('docProps/core.xml'))# retrieve creatorns={'dc': 'http://purl.org/dc/elements/1.1/'}creator = doc.xpath('//dc:creator', namespaces=ns)[0].text
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)