Python office | 深入了解文件的属性

Kate 2020-11-12 22:24:50

目标

无论是window、Linux或者Mac系统,都会存在 wps/office/PPT/Excel 文档,当然内容多了就需要统计数据,进行数据分析,数据处理。

如何继续呢?思路是如何处理这些文件,进行统计?

不同需求,就会有不同的统计思路,简单的是对此类文件的信息进行整理,获取其中的文件作者、标题、修改时间、文件大小等等,那我们一起来看看到底是些什么内容?

本篇参考的是Mac系统下的文件,不过小编在Window系统也操作实践一轮,大同小异。使用自己编写的程序自动进行信息提取。

如图:

  • test.ppt

  • test.docx

ex: size,date created,kind,tags,comments

附录

Core Document Properties

Python-pptx Presentations

openpyxl - A Python library to read/write Excel 2010 xlsx/xlsm files

下载Python的库

python-docx

python-pptx

openpyxl

Last updated

Was this helpful?