福利!GitHub上6个超强开源机器学习库盘点

2023-06-27 0 813

概要共2433字,预计今年自学时数5两分钟

福利!GitHub上6个超强开源机器学习库盘点

1. XLNet:新一代小型语义处置架构

半条命:https://github.com/zihangdai/xlnet

语义处置是现阶段机器自学应用领域最炙手可热的热门话题,责任编辑也将从这儿早已开始。在我看来泡果的2018年是机器自学产业发展的关键性之年,所以2019年早已胜过了它。

XLNet是现阶段最一流的语义处置架构,它给语义处置应用领域,即使整座机器自学应用领域增添了巨大变动的变化。XLNet选用Transformer-XL做为其萨温齐数学模型。在此之后,开发人员还开放源码了其预体能训练数学模型,以期德国大众自学采用XLNet。

到为止,XLNet早已在20项语义处置各项任务上少于了BERT的整体表现,因此在18项各项任务上获得了现阶段最差效用。上面列举了两者在写作认知各项任务的两个常用来衡量层次上的试验结论。

福利!GitHub上6个超强开源机器学习库盘点

假如想介绍更多,下列是文档进行分类各项任务的试验结论。

福利!GitHub上6个超强开源机器学习库盘点

不无生硬地说,XLNet的整体表现极为出众。

学术论文概要半条命:https://arxiv.org/abs/1906.08237

2. 在PyTorch上运转XLNet

半条命:https://github.com/graykode/xlnet-Pytorch

想知道如何在自己的设备上安装XLNet吗?别急,这个机器自学库可以给你及时的帮助。

假如你早已足够介绍语义处置的各种特点,所以认知这个也不会太难。可是,假如是初次涉足这一应用领域,那最好能先花点时间通读一下上文提及的相关资料,然后再早已开始。

除了预体能训练数学模型,开发人员其实还在Google Colab上开放源码了全部的体能训练代码,因此德国大众也可以免费利用其GPU。所以,这个语义处置架构绝对不容错过。

开放源码代码半条命:https://colab.research.google.com/github/graykode/xlnet-Pytorch/blob/master/XLNet.ipynb

3. Google Research Football—独特的强化自学环境

半条命:https://github.com/google-research/football

Google Research和足球?这两者之间有什么关系呢?

实际上,这个机器自学库包含一个基于开放源码游戏Gameplay Football的强化自学环境。该强化自学环境由谷歌研究团队打造,因此仅用于科学研究。下列就是在此环境中模拟出来的部分场景:

福利!GitHub上6个超强开源机器学习库盘点

其中,智能体被体能训练在一个一流的、基于物理的3D模拟环境中踢足球。过去几年里我也有见到一些强化自学环境,然而相比之下,这个的效用最好。

此篇学术论文极为有趣,假如你是一个足球迷或是一个强化自学的爱好者(或者两者都是),那就更不容错过。

学术论文半条命:https://github.com/google-research/football/blob/master/paper.pdf

4. CRAFT文档检测器

半条命:https://github.com/clovaai/CRAFT-pytorch

这一概念非常有趣。CRAFT的全称是Character Region Awareness for TextDetection,意为“用于文档检测的字符区域识别”。假如你对计算机视觉感兴趣,所以最好介绍一下这项技术。仔细观察一下这些GIF图片:

福利!GitHub上6个超强开源机器学习库盘点

你能认知这一算法是如何运转的吗?实际上,CRAFT能够通过识别图中出现的每一个字符区域来检测文档区域。而文档的边框只需通过在二值图上找出最小边界矩形即可检测出。

假如你很熟悉目标检测,认知CRAFT就容易的多。该仓库早已包含了一个预体能训练数学模型,因此无需从头编写这一算法。

更多解读半条命:https://arxiv.org/abs/1904.01941

5. MMAction—开放源码视频动作分析工具箱

半条命:https://github.com/open-mmlab/mmaction

有过处置视频数据经历的人都知道,这个过程确实非常具有挑战性,但是过后也一定会有所收获。想想我们能从视频中提取出的海量信息和能做的分析就可以认知这一点。

比如,该如何分析某个视频帧中出现的动作呢?这项工作其实可以由MMAction完成。MMAction是一个基于PyTorch的开放源码动作分析工具包。按照它的代码库,MMAction能执行下列各项任务:

· 在剪辑后的视频中进行动作识别。

· 在剪辑后的视频中进行时域动作检测(也叫做动作本地化)。

· 在剪辑后的视频中进行时空动作检测。

此外,MMAction的开发人员也提供了多种工具以处置不同类型的视频数据集。为方便采用,该开放源码库还提供了许多指导步骤。

MMAction新手指南半条命:https://github.com/open-mmlab/mmaction/blob/master/GETTING_STARTED.md

6. TRAINS—神奇的自动化AI实验管理器和版本控制器

半条命:https://github.com/allegroai/trains

软件工程是成为一名数据科学家最重要、也是必备的技能,然而它的重要性却常被忽视。知道如何建模确实很重要,但是,介绍某个项目软件层面的东西也同样重要。

福利!GitHub上6个超强开源机器学习库盘点

假如你之前从未听说过版本控制,请赶紧去扫一下盲。TRAINS能够“记录并管理多种深度自学研究工作,因此几乎不需要付出集成成本。”

虽然TRAINS的优点很多,但是最棒的还是它的免费开放源码,仅需两行代码即可集成TRAINS至环境中。此外,TRAINS也可以与PyTorch、TensorFlow和Keras无缝集成,因此支持Jupyter notebooks。

开发人员早已开放了相关Demo服务器。赶紧去TRAINS试试你的代码吧。

福利!GitHub上6个超强开源机器学习库盘点

我们一起分享AI自学与产业发展的干货

编译组:孙宇超、许若琳

相关链接:

https://www.analyticsvidhya.com/blog/2019/07/6-powerful-open-source-machine-learning-github-repositories-data-scientists/

如需转载,请后台留言,遵守转载规范

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务