郭一璞 丽翔 纽凹非寺
用Python搞机器自学、统计数据数据自然科学,须要许多有关的统计数据数据资料,各式各样库、辅助工具,都是常见、常找、常查的文档。
前段时间,柏林的统计数据数据生物学家Florian Rohrer把此类有关统计数据数据资料重新整理成了两个Python机器自学辅助工具优选集,能照著预览呵呵他们的电话簿了。
三十四类工程项目
整座条目中,包涵少于40类内容:
核心理念辅助工具、Pandas和Jupyter、文档抽取、大统计数据数据、统计数据、求逆、建模、自然地理辅助工具、所推荐控制系统、计算机程序、NLP、CV、数学模型、GPU、控制点、机器自学可如前所述、加强自学……
具体内容都有甚么呢?比如第三部份核心理念辅助工具:
pandas、scikit-learn那些常见的库都有,间接镜像到它的GitHub或是官方网站网页。
再比如说建模部份:
包括能生成3D效果图的physt:
做各式各样统计数据图表的Yellowbrick:
这哪怕是做PPT,都非常有用啊!
天然资源条目大集结
另外,工程项目贡献者还安利了几个GitHub上不错的天然资源条目:
大部份都是几百几千星的天然资源表,也有不少标星数万的经典文档,比如说awesome-machine-learning:
各式各样语言工程项目都有,是真的awesome。
常见代码
最后,还有两个部份是“经常Google的文档”。
可能对大家有用的代码: