2018年将会是人工智慧和机器自学加速发展的两年,有研究者则表示:相较下Python比Java更为接地气,也顺理成章地正式成为机器自学的必选词汇
在统计数据自然科学各方面,Python的句法与微积分句法最吻合,因而是数学家或分析师等从业者最难认知和自学的词汇。责任编辑将详列机器自学和统计数据自然科学应用流程中最管用的五大Python辅助工具
机器自学辅助工具
1、Shogun
SHOGUN是两个机器自学辅助widget,著眼于全力支持矢量机(SVM)的自学辅助widget。它是用C++撰写的,早在1999年就已经建立,是最有名的机器自学辅助工具众所周知,它提供更多了广为的标准化机器自学方式,意在为机器自学提供更多透明化和可出访的演算法,并为任何人为此应用领域钟爱的人提供更多完全免费的机器自学辅助工具。
Shogun提供更多了两个历史记录健全的Python介面用作标准化的小规模自学,并提供更多高效能速率。但是,Shogun的优点是它的API极难采用。(工程项目门牌号:
https://github.com/shogun-toolbox/shogun)2、Keras
Keras是两个高级微积分模型API,提供更多了两个Python广度自学库。对任何人新手而言,这是机器自学的最差优先选择,即使与其它库较之,它提供更多了一类更单纯的抒发微积分模型的方式。Keras由纯Python撰写而成并基Tensorflow、Theano和CNTK前端。
据官网称,Keras着重于4个主要辅导准则,即采用者亲善性,模组化,易扩展性和与Python协作。然而,就速率而言,Keras 相对还是比较弱的。(工程项目门牌号:
https://github.com/keras-team/keras)3、scikit-learn
scikit-learn 是两个 Python 的机器自学工程项目。是两个单纯高效的统计数据挖掘和统计数据分析辅助工具。基于 NumPy、SciPy 和 matplotlib 构建。Scikit-Learn提供更多了一致且易于采用的API网格以及随机搜索。其主要优势演算法单纯而且速率快。Scikit-learn的基本功能主要被分为六大部分:分类,回归,聚类,统计数据降维,模型优先选择和统计数据预处理(工程项目门牌号:
https://github.com/scikit-learn/scikit-learn)4、Pattern
Pattern是两个Web挖掘模块,为统计数据挖掘,自然词汇处理,机器自学,互联网分析和互联网分析提供更多辅助工具。它还附带健全的文档,有50多个示例以及通过350多个单元测试。最重要的是,它是完全免费的!(工程项目门牌号:
https://github.com/clips/pattern)5、Theano
Theano可以说是最成熟的Python广度自学库众所周知,Theano是以以为希腊毕达哥拉斯哲学家和物理学家毕达哥拉斯的妻子的名字命名,Theano的主要功能:与NumPy紧密集成,用符号式词汇定义你想要的结果,该框架会对你的流程进行编译,来高效运行于 GPU 或 CPU。
它还提供更多了定义,优化和评估微积分抒发式的辅助工具,并且可以在Theano上构建大量其它库,以探索其统计数据结构。尽管如此,采用Theano还是有一些优点的; 比如自学它的API可能需要很长时间,而另一些人则认为Theano大模型的编译时间显的它不够高效(工程项目门牌号:
https://github.com/Theano/Theano)统计数据自然科学辅助工具
1、SciPy
SciPy (pronounced “Sigh Pie”) 是两个开源的微积分、自然科学和工程计算包。SciPy采用NumPy,IPython或Pandas等各种软件包为常用的微积分和自然科学编程任务提供更多库。当你想操纵计算机上的数字并显示或发布结果时,此辅助工具是两个很好的优先选择,并且它也是完全免费的。(工程项目门牌号:
https://github.com/scipy/scipy)2、Dask
Dask 是两个用作分析计算的灵活的并行计算库。同样,通过更改只有几行代码,你可以加速对现有代码进行并行处理,即使它的DataFrame与Pandas库中的相同,它的Array对象的工作方式类似于NumPy能够并行化以纯Python撰写。(工程项目门牌号:
https://github.com/dask/dask)3、Numba
此辅助工具是一类开源优化编译器,它采用LLVM编译器基础结构将Python句法编译为机器码。在统计数据自然科学应用中采用Numba的主要优势在于它采用NumPy数组来加速应用流程的能力,即使Numba是两个全力支持NumPy的编译器。就像Scikit-Learn一样,Numba也适用作机器自学应用。(工程项目门牌号:
https://github.com/numba/numba)4、HPAT
高效能分析辅助工具包(HPAT)是两个基于编译器的大统计数据框架。它将Python中的分析/机器自学代码自动扩展到群集/云环境中的大统计数据分析和机器自学,并可以采用@jit装饰器优化特定功能。(工程项目门牌号:
https://github.com/IntelLabs/hpat)5、Cython
采用微积分密码或密码循环运行的代码时,Cython是您的最差优先选择。Cython是一款基于Pyrex的源代码翻译器,可加速生成Python扩展模块(extention module)的辅助工具。Cython词汇非常吻合Python词汇,但是Cython还全力支持调用C函数并在变量和类属性上声明C类型。这允许编译器从Cython代码生成非常高效的C代码。(工程项目门牌号:
https://github.com/cython/cython)