假如我想把一个有图片又有文字的wPS文档存入mongo,怎么办
来源:2-2 新闻管理系统修改新闻正文记录
kkkkke
2019-06-03 21:19:44
例如我们的作业批复文档,有图片也有汉字,想要存入mongo,怎么做,我试了一下,GKB和utf-8,都读不出来,rb倒是可以读出来
2回答
时间,
2019-06-04
同学,你好,Python可以利用python-docx模块处理word文档,使用pip install python-docx(只能读取.docx文件,不能读取.doc文件)。同学可以作为了解。
参考代码:
from win32com import client as wc import docx # 首先将doc转换成docx word = wc.Dispatch("Word.Application") doc = word.Documents.Open(r"E:\python练习\文档.doc") # 路径要写完整 #使用参数16表示将doc转换成docx doc.SaveAs(r"E:\python练习\文档.docx",16) doc.Close() word.Quit() # 读取文档内容 # Document对象,表示一个word文档。 file = docx.Document("E:\\python练习\\文档.docx") print("段落数:" + str(len(file.paragraphs))) # 输出每一段的内容 # Paragraph对象的text属性,表示段落中的文本内容 for para in file.paragraphs: print(para.text)
时间,
2019-06-04
同学,你好。GBK和utf-8只可以读取相对应编码格式的文档,当读取二进制文件时如图片或视频,要以'rb'二进制的形式打开并读取文件内容。rb既可以读取文字也可以读取图片。
如果我的回答解决了您的疑惑,请采纳!祝学习愉快~~~~
相似问题
回答 2
回答 1