假如我想把一个有图片又有文字的wPS文档存入mongo,怎么办

来源:2-2 新闻管理系统修改新闻正文记录

kkkkke

2019-06-03 21:19:44

例如我们的作业批复文档,有图片也有汉字,想要存入mongo,怎么做,我试了一下,GKB和utf-8,都读不出来,rb倒是可以读出来

写回答

2回答

时间,

2019-06-04

同学,你好,Python可以利用python-docx模块处理word文档,使用pip install python-docx(只能读取.docx文件,不能读取.doc文件)。同学可以作为了解。

参考代码:

from win32com import client as wc
import docx

# 首先将doc转换成docx
word = wc.Dispatch("Word.Application")
doc = word.Documents.Open(r"E:\python练习\文档.doc")  # 路径要写完整
#使用参数16表示将doc转换成docx
doc.SaveAs(r"E:\python练习\文档.docx",16)
doc.Close()
word.Quit()

# 读取文档内容
# Document对象,表示一个word文档。
file = docx.Document("E:\\python练习\\文档.docx")
print("段落数:" + str(len(file.paragraphs)))
# 输出每一段的内容
# Paragraph对象的text属性,表示段落中的文本内容
for para in file.paragraphs:
    print(para.text)


0

时间,

2019-06-04

同学,你好。GBK和utf-8只可以读取相对应编码格式的文档,当读取二进制文件时如图片或视频,要以'rb'二进制的形式打开并读取文件内容。rb既可以读取文字也可以读取图片。

如果我的回答解决了您的疑惑,请采纳!祝学习愉快~~~~

0
hkkkke
h 如果要读取doc文件内容呢
h019-06-04
共1条回复

0 学习 · 2669 问题

查看课程