Day: March 16, 2021

python 解析docx文档的方法,以及利用Python从docx文档提取插入的文本对象和图片

首先安装docx模块,通过pip install docx或者在docx官方链接上下载安装都可以 下面来看下如何解析docx文档:文档格式如下 有3个部分组成 1 正文:text文档 2 一个表格。 3一个插入的文件对象。4 一个图片 这4个部分是我们在docx文档中最常见的几种格式。解析代码如下 import docx def docx_try():     doc=docx.Document(r’E:\py_prj\test.docx’)     for p in doc.paragraphs:         print p.text     for t in doc.tables:         for r in t.rows:             for c in r.cells:                 […]

blueidea