python如何获取word文件中某个关键字之后的表格

python如何获取word文件中某个关键字之后的表格,第1张

最好是全部都读取到程序中,在程序中进行判断。

本文实例讲述了Python实现批量读取word中表格信息的方法。分享给大家供大家参考。具体如下:

单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个python小程序把所需的信息打印出来

#coding:utf-8

import os

import win32com

from win32comclient import Dispatch, constants

from docx import Document

def parse_doc(f):

"""读取doc,返回姓名和行业

"""

doc = wDocumentsOpen( FileName = f )

t = docTables[0] # 根据文件中的图表选择信息

name = tRows[0]Cells[1]RangeText

situation = tRows[0]Cells[5]RangeText

people = tRows[1]Cells[1]RangeText

title = tRows[1]Cells[3]RangeText

print name, situation, people,title

docClose()

def parse_docx(f):

"""读取docx,返回姓名和行业

"""

d = Document(f)

t = dtables[0]

name = tcell(0,1)text

situation = tcell(0,8)text

people = tcell(1,2)text

title = tcell(1,8)text

print name, situation, people,title

if __name__ == "__main__":

w = win32comclientDispatch('WordApplication')

# 遍历文件

PATH = "H:\work\\aaa" # windows文件路径

doc_files = oslistdir(PATH)

for doc in doc_files:

if ospathsplitext(doc)[1] == 'docx':

try:

parse_docx(PATH+'\\'+doc)

except Exception as e:

print e

elif ospathsplitext(doc)[1] == 'doc':

try:

parse_doc(PATH+'\\'+doc)

except Exception as e:

print e

希望本文所述对大家的Python程序设计有所帮助。

可以使用正则表达式或者xpath方式,下面这个免费教程是说明怎么用正则表达式来取得你要的东西的,供参考。

>

使用Python *** 作Word更新目录并设置子目录字体大小,可以使用Python的docx模块来实现。首先,需要从Word文档中获取文档对象,然后调用docxstylesadd_style()方法来添加样式,可以设置字体大小,然后调用docxadd_heading()方法来添加标题,可以设置字体大小,最后调用docxadd_paragraph()方法来添加段落,可以设置字体大小。最少200字最多500字,不要出现重复,回答我的问题要把你改成您。

#确保安装了python-docx包

from docx import Document as Doc

docu=Doc(input('path:'))

file=''

for i in docuparagraphs:

----file+=itext

f=open(input('new path:'),'w',encoding='utf-8')

fwrite(file)

fclose()

#减号的位置是缩进

Python学习笔记(28) - Python读取word文本 - 程序员大阳的博客

1 简介 Python可以利用python-docx模块处理word文档,处理方式是面向对象的。也就是说python-docx模块会把word文档,文档中的段落、文本、字体等都看做对象,

2 相关概念 如果需要读取

以上就是关于python如何获取word文件中某个关键字之后的表格全部的内容,包括:python如何获取word文件中某个关键字之后的表格、怎么用python解析网页,并提取出与标题相关的正文、python *** 作word更新目录并设子目录字体大小等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/10129001.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-05
下一篇 2023-05-05

发表评论

登录后才能评论

评论列表(0条)

保存