此次文本囊括了Excel、Word、PPT、ODF、PDF、电子邮件、QQ、文档处置等大部份能在办公设备情景同时实现智能化的库,期望能对我们略有协助。
PythonExcel智能化库
//1.xlwings 库
官方网站:https://www.xlwings.org/特征:xlwings 是开放源码且完全免费的,预载了 Anaconda 和 WinPython,可在 Windows 和 macOS 上运转。透过 Python JAVA或 Jupyter notebook 智能化 Excel,透过宏从 Excel 初始化 Python,并撰写使用者表述的表达式(UDF 仅适用作于 Windows)
//2.openpyxl 库
官方网站:https://openpyxl.readthedocs.io特征:openpyxl 是两个用作加载/ 撰写 Excel 2010 xlsx/xlsm/xltx/xltm 文档的 Python 库。它是虽然缺少从 Python 中加载/ 撰写 Office Open XML 文件格式的原有库而问世的。
//3.xlrd 库
官方网站:https://pypi.python.org/pypi/xlrd特点:在 python 中,xlrd 别列济夫两个很常见的加载 excel 文档的库,其对 excel 文档的加载能同时实现较为精巧的掌控。
//4.xlwt 库
官方网站:https://pypi.org/project/xlwt/特征:等效于 xlrd 的 reader,所以 xlwt 就相对于 writer,所以很正宗的一点儿是它根本无法对 Excel 展开写操作方式。xlwt 和 xlrd 不仅英文名字像,连很多表达式和操作方式文件格式也是完全一致。
//5.xlutils 库
官方网站:https://pypi.org/project/xlutils/特征:xlutils(excel utilities)是两个提供更多了很多操作方式修正 excel 文档方式的库。xlutils 库也实际上是透过拷贝两个复本展开操作方式后留存两个新文档,xlutils 库就像 xlrd 库和 xlwt 库间的一处公路桥,因而,xlutils 别列济夫倚赖 xlrd 和 xlwt 两个库的。
//6.xlsxwriter 库
官方网站:https://xlsxwriter.readthedocs.io/特征:xlsxwriter 是用作创建 Excel XLSX 文档的 Python 模块,可用作将文本、数字、公式和超链接写入 Excel2007+ XLSX 文档中的多个工作表。它支持文件格式化等功能。能说除了 Excel 本身,就属这个功能最齐全了。
//7.pandas 库
官方网站:https://www.pypandas.cn/docs/特征:pandas 是基于 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供更多了高效地操作方式大型数据集所需的工具。
//8.Marmir 库
官方网站:https://github.com/brianray/mm特征:Marmir 采用 Python 数据结构并将其转换为电子表格。它是类固醇上的 xlwt 和 google 电子表格。目标是使用最少的配置轻松生成多种类型的有用表文档。
PythonWord智能化库
//9.python-docx 库
官方网站:https://python-docx.readthedocs.io/en/latest/特征:python-docx 是两个用作创建和更新 Microsoft Word (.docx)文档的 Python 库。快速开始、处置文档、处置文本、使用截面、使用页眉和页脚、API基础理、解样式、使用样式理解图片和其他形状。只对 windows 平台有效。
//10.textract 库
官方网站:https://gitee.com/mirrors/textract特征:它同时兼顾“doc”和 “docx”,但安装过程需要一些依赖。你能批量的用 python 生成 word 文档,推荐使用 docx,不需要会太多。
PythonPPT智能化库
//11.python-pptx 库
官方网站:https://python-pptx.readthedocs.io特征:python-pptx 是两个用作创建和更新 PowerPoint (.pptx)文档的 Python 库。典型用途是从数据库文本生成自表述 PowerPoint 演示文稿,可透过单击 Web 应用程序中的链接下载。
PythonODF智能化库
//12.Relatorio 库
官方网站:https://pypi.org/project/relatorio/特征:Relatorio 是两个模板库,它提供更多了一种轻松输出多种文档(odt、ods、png、svg 等)的方式。透过为它们创建插件能轻松添加对更多文档类型的支持。Relatorio 还提供更多了两个报告存储库,允许您将 python 对象和报告链接在一起,按 mimetype/name/python 对象查找报告。ODF:开放文档文件格式(外文名:OpenDocument Format,外语简称:ODF)是一种规范,基于 XML(标准通用标记语言的子集)的文档文件格式,因应试算表、图表、演示稿和文字处置文档等电子文件而设置。
PythonPDF智能化库
//13.PyPDF2库
官方网站:https://github.com/mstamy2/PyPDF2特征:PyPDF2是两个纯 Python PDF 库,能拆分、合并、裁剪和转换 PDF 文档的页面。它还能向 PDF 文档添加自表述数据、查看选项和密码。它能从 PDF 中检索文本和元数据,也能将整个文档合并在一起。
//14.ReportLab 库
官方网站:https://www.reportlab.com/opensource/特征:ReportLab 是久经考验、超强大的开放源码引擎,用作创建复杂的、数据驱动的 PDF 文档和自表述矢量图形。它是完全免费的、开放源码的,并且是用 Python 撰写的。
//15.PDFminer 库
官方网站:https://github.com/euske/pdfminer特征:PDFMiner 是一款用作 PDF 文档的文本提取工具。
Python电子邮件智能化库
//16.Django Celery SES 库
官方网站:https://github.com/StreetVoice/django-celery-ses特征:这个包提供更多了两个 EmailBackend 来利用 django-celery 发送电子电子邮件。您能将 EmailBackend 插入您的项目中,而无需对代码展开任何修正。
//17.Envelopes 库
官方网站:http://tomekwojcik.github.io/envelopes/特征:Envelopes 是 Python 的电子电子邮件和 smtplib 模块的包装器。它旨在使在 Python 中处置外发电子电子邮件变得简单而有趣。
//18.Flanker 库
官方网站:https://github.com/mailgun/flanker特征:由 mailgun 开放源码的 Flanker – email address and MIME parsing for Python 是两个解析高效、容错率不错的 python 第三方扩展库。python 3也能正常使用,该库包含了电子邮件地址解析和电子邮件 mime 文件格式解析。
//19.imbox 库
官方网站:https://github.com/martinrusev/imbox特征:用作加载 IMAP 邮箱并将电子电子邮件文本转换为机器可读数据的 Python 库
//20.inbox.py 库
官方网站:https://github.com/billzhong/inbox.py特征:这是您见过的最简单的 SMTP 服务器。它是异步的。两个实例每秒应该处置一千多封电子电子邮件。
//21.sync-engine 库
官方网站:https://github.com/nylas/sync-engine特征:Nylas 同步引擎在强大的电子电子邮件同步平台之上提供更多了两个 RESTful API,能轻松地在电子电子邮件之上构建应用程序。
//22.Lamson 库
官方网站:https://github.com/zedshaw/lamson特征:Lamson 是两个纯 Python SMTP 服务器,旨在以现代 Web 框架(如 Django)的风格创建强大而复杂的电子邮件应用程序。
//23.Marrow Mailer 库
官方网站:https://github.com/marrow/mailer特征:Marrow Mailer 是两个 Python 库,能轻松地从您的应用程序发送电子电子邮件。透过使用 Marrow Mailer,您能:轻松构建纯文本和 HTML 电子电子邮件;提高电子电子邮件传递的可测试性;使用不同的电子邮件投递管理策略;例如立即,延迟,甚至多服务器等。
//24.Modoboa 库
官方网站:https://github.com/modoboa/modoboa特征:Modoboa 是两个电子邮件托管和管理平台,包括两个现代和简化的 Web 使用者界面。它提供更多了有用的组件,例如管理面板或网络电子邮件。
//25.smtplib 库
官方网站:https://docs.python.org/zh-cn/3/library/smtplib.html特征:smtplib 模块是 python 中 smtp (简单电子邮件传输协议)的客户端同时实现。我们能使用 smtplib 模块,轻松的发送电子电子邮件。
PythonQQ智能化库
//26.Python wxpy 库
官方网站:https://wxpy.readthedocs.io/zh/latest/特征:QQ机器人/可能是最优雅的QQ个人号API,wxpy 在 itchat 的基础上,透过大量接口优化提升了模块的易用性,并展开丰富的功能扩展。
Python文档处置智能化库
//27.os 库
官方网站:https://docs.python.org/zh-cn/3/library/os.html?highlight=os#module-os特征:本模块提供更多了一种使用与操作方式系统相关的功能的便捷式途径。如果你只是想读写两个文档,请参阅 open(),如果你想操作方式文档路径,请参阅 os.path 模块,如果你想加载透过命令行给出的大部份文档中的大部份行,请参阅 fileinput 模块。为了创建临时文档和目录,请参阅 tempfile 模块,对于高级文档和目录处置,请参阅 shutil 模块。
Python综合功能智能化库
//28.win32com 库
官方网站:https://pypi.org/project/pywin32/特征:win32com 模块主要为 Python 提供更多初始化 windows 底层组件对 word 、Excel、PPT 等展开操作方式的功能,根本无法在 Windows 环境下使用,并且需要安装 office 相关软件才行(WPS 也行)。
//29.unoconv 库
官方网站:https://github.com/unoconv/unoconv特征:是两个命令行工具,能将 LibreOffice 能导入的任何文档文件格式转换为 LibreOffice 能导出的任何文档文件格式。它利用 LibreOffice 的 UNO 绑定展开文档的非交互式转换,也支持 OpenOffice。
//30.Tablib 库
官方网站:https://www.osgeo.cn/tablib/特征:Python tablib 模块是第三方模块,主要作用是将数据导出为各种不同的文件格式,包括 excel,json,html,yaml,csv,tsv 等文件格式,怎么样,有点心动了吧,当然这个模块使用起来也是超级简单的。
//31.SnowNLP 库
官方网站:https://github.com/isnowfy/snownlp特征:SnowNLP 是两个 python 写的类库,能方便的处置中文文本文本,是受到了 TextBlob 的启发而写的,虽然现在大部分的自然语言处置库基本都是针对英文的,于是写了两个方便处置中文的类库,并且和 TextBlob 不同的是,这里没有用 NLTK,大部份的算法都是自己同时实现的,并且自带了一些训练好的字典。注意本程序都是处置的 unicode 编码,所以使用时请自行 decode 成 unicode。
//32.TextBlob 库
官方网站:https://textblob.readthedocs.io特征:TextBlob 是两个用作处置文本数据的 Python(2和 3)库。它提供更多了两个简单的 API,用作深入研究常见的自然语言处置(NLP)任务,例如词性标注、名词短语提取、情感分析、分类、翻译等。
//33.TextGrocery 库
官方网站:https://textgrocery.readthedocs.io特征:TextGrocery 是两个基于 LibLinear 和结巴分词的短文本分类工具,特征是高效易用,同时支持中文和英文语料。
//34.NumPy 库
官方网站:https://www.numpy.org.cn/特征:NumPy 是 Python 中科学计算的基础包。它是两个 Python 库,提供更多多维数组对象,各种派生对象(如掩码数组和矩阵),以及用作数组快速操作方式的各种 API,有包括数学、逻辑、形状操作方式、排序、选择、输入输出、离散傅立叶变换、基本线性代数,基本统计运算和随机模拟等等。