译者 | Khoa Pham 翻译者 | Shawn Lee
原副标题:25 Open-Source Machine Learning Repos to Inspire Your Next Project在过去的一两年里,机器学习为各个应用领域缔造了新世纪,问世了许多获得成功的事例: Facebook 的脸部辨识,Netflix 的智能化影片所推荐系统,PrimaAI 的影像艺术风格切换,Siri 的音频辨识,Google Allo 的语义处置,及其他很多合作开发中的工程项目。
除了那些事例之外,GitHub 上有大量代销的开放源码机器学习工程项目。我们挑选出了倍受我们热烈欢迎的工程项目,那些工程项目囊括 CV、NLP 及音频三大应用领域的 25 个开放源码工程项目,包括:怎样让机器学习音乐创作音乐音乐创作、曲目;怎样为设计图、位图影像裁剪;相片艺术风格切换;音频艺术风格北迁;在 IOS 或 Android 上展开脸部检验与感情进行分类;提供更多格斗游戏科学研究互联网平台;最一流的球体检验演算法的实现;舰载与汽车的辅助工具包;损坏影像的恢复正常辅助工具、消化系统突破点检验等内容。希望我们能从小学到捷伊科学知识并得到启迪。
▌TensorFlow
TensorFlow 是一个用于科学研究和生产的开放源码机器学习库。 TensorFlow 为新手和研究者提供更多了各种API,以期对图形界面、终端终端产品、Web和云展开合作开发。
TensorFlow 由 Google Brain 项目组合作开发,起初只供 Google 外部使用。2015年11月 9 日,TensorFlow 在 Apache 2.0 开放源码许可证下发布。新一代版的 TensorFlow 支持 Keras,它是一种用 Python 撰写的高级神经互联网 API,能够在 TensorFlow, CNTK 或 Theano 其内运转。Keras 也包涵 Javascript 和 Swift 的USB。
COMPILATION1元直降>>SVM与XGBoost体能训练 第5期 [上工秘书长QQ领幻灯片,进释疑群] – 八月新浪网
▌Scikit-learn
Scikit-learn 是基于 NumPy、SciPy 和 Matplotlib 的一款简单有效的数据挖掘和数据分析辅助工具。 由于其简单和便捷的功能,它常与 TensorFlow 一起使用。
▌MXNet
除了 TensorFlow 、Keras 和 Scikit-learn 之外,Apache 的 MXNet 也是一款深度学习的框架辅助工具。 它专为提高效率和灵活性而设计,允许混合使用符号和命令式编程,以最大限度地提高效率和生产力。
▌PyTorch
PyTorch 绝对是这个列表里一定要提到的一款应用,它在机器学习爱好者里享有很高的知名度。 PyTorch 基于 Torch ,并由 Facebook 作为其机器学习的框架发布。 PyTorch 是一个 Python 包,它提供更多两个高级功能:由强 GPU 支持的加速张量计算(如 NumPy ),其深度神经互联网是建立在基于磁盘的 autograd 包上。
https://twitter.com/pytorch/status/966324198758006784)
▌magenta
Magenta 目前还在科学研究过程中,它致力于探索怎样让机器学习参与艺术和音乐音乐创作的音乐创作。 它主要涉及创新合作开发深度学习和强化学习的演算法以用于生成曲目、影像、绘图和其他素材。 同时,Magenta 也是对于怎样构建智能化辅助工具和界面的探索,它允许艺术家和音乐音乐创作家使用那些模型扩展(而不是取代!)他们的音乐创作路径。
它主要的库适配于 python ,除此之外也有 Javascript 的版 — magenta.js 。 在艺术音乐创作里,大部分人可能从未想过高级机器学习可以使用在这个应用领域,但 Megenta 向人们完美地展示了应用的可能性。点击这里观看那些令人惊叹的声音和绘图生成器的演示吧。
▌style2paints
该工程项目旨在为线稿着色。 AI 可以根据既定的颜色样式在设计图上绘制、或在设计图上创建绘制自己的颜色艺术风格、亦或者将现有的艺术风格切换至另一种艺术风格。
有一些值得一看的捷伊功能,例如色彩锚和影像过渡。
▌Image-to-image translation in PyTorch
该工程项目有两个组成部分,CycleGAN 和 pix2pix 。基于 PyTorch ,它们可以实现用于未配对和成对的影像到影像切换。 乍看之下,它仿佛只是一种相当普通的艺术风格转移解决方案,事实上,它跟其他应用不一样。比如它能将相片里普通的马切换为斑马或从实景照片切换为莫奈艺术风格的画作。并且它的处置速度快到足以在实时视频上应用。
▌Deep voice conversion
列表上已经罗列了一些用于影像和视频的艺术风格切换辅助工具了,但是音频呢? 深度音频切换便是此功能的完美示例。
如果你可以模仿名人的声音或拥有著歌手一样歌喉,你会怎么干点什么? 深度音频切换的目的是将任意人的声音切换为特定的目标声音,也就是所谓的音频艺术风格转移。工程项目开始时,我们目标将任意人的声音切换为著名的英国女演员 Kate Winslet 的声音。 我们使用了一个深度神经互联网和由 Kate Winslet 朗读的2小时有声读物作为数据集来实现这一目标。
▌StarGAN in PyTorch
StarGAN 是这篇文章中提到的一个 PyTorch 应用:Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation。它可以将源影像切换成不同的发型、皮肤类型、年龄、性别和不同的情绪。
▌Face detection
脸部检验听起来不太吸引人,因为我们可以在 iOS 和 Android 上使用 Core ML 或 ML Kit 轻松地完成这项工作。 但是随着深入了解,你会发现它不仅可以检验脸部,还可以检验情绪和性别。
使用 Keras CNN 模型和 OpenCV 在 fer2013 / IMDB 数据集的展开实时人脸检验和感情/性别进行分类。
▌Deep universal probabilistic programming
Uber AI Labs 构建了这个深度概率编程库,用于简化其运输服务的预测和优化收益。 任何处置概率建模的人都会对这个库感兴趣。
机遇无处不在,从匹配乘客和驾驶员,建议最佳路线,找到最明智的搭配组合,甚至创造下一代智能化车辆。 为了解决那些挑战,我们将最一流的人工智能化(AI)技术与数据科学家、工程师和其他用户的丰富专业科学知识相结合。 我们正在探索一种辅助工具优先的方法,使我们和其他人能够制作下一代AI解决方案。
▌ParlAI
作为 Facebook 科学研究工程项目的一部分,ParlAI 是一个用于在各种公开可用的对话数据集上训练和评估 AI 模型的框架。 ParlAI 是一个在为科学研究人员提供更多访问许多流行数据集的权限的同时,也可以共享和测试对话模型的统一框架。
▌Facets
Facets 一种可视化机器学习数据集的辅助工具。
可视化由 Polymer Web 组件实现,由 Typescript 代码支持,可以轻松嵌入到 Jupyter 笔记本或网页中。
可视化的关键是跨多个数据集的异常检验和分布比较。 有趣的值(例如,大量的缺失数据,或跨多个数据集非常不同的特征分布)以红色突出显示。
▌ELF with AlphaGoZero
ELF 是 AlphaGoZero / AlphaZero 实现的格斗游戏科学研究互联网平台。 ELF 为格斗游戏科学研究提供更多端到端解决方案。 它包括微型实时战略格斗游戏环境,并发模拟,数千台机器的分布式培训,直观的 API ,基于 Web 的可视化以及由 PyTorch 提供更多支持的强化学习框架。
▌Detectron
Detectron 是 Facebook AI Research 的软件系统,它实现了最一流的球体检验演算法,包括 Mask R-CNN 。 它是用 Python 撰写的,由 Caffe2 深度学习框架提供更多支持。
▌Fast Style Transfer
使用 TensorFlow CNN 实现,这可能是影像样式传输的最佳示例之一,顾名思义,它的完成速度非常快。 该工程项目基于 Gatys 的艺术艺术风格的神经演算法, Johnson 对实时样式切换和超分辨率的感知损失以及 Ulyanov 的实例规范化的组合 。
▌Face recognition
此辅助工具提供更多简单的脸部辨识 API 。 它可以找到脸部特征,并猜出照片中的人物。
使用 dlib 最一流的脸部辨识功能构建而成,并通过深度学习构建。 该模型在 Wild 标记的 Labeled Faces 中具有 99.38% 的准确度。
这还提供更多了一个简单的 face_recognition 命令行辅助工具,可以让您从命令行对影像文件夹展开人脸辨识!
▌Deep photo style transfer
另一个十分好用的相片艺术风格切换辅助工具。 这篇文章里包涵本应用的代码和科学研究论文: Deep Photo Style Transfer 。 它提供更多了简单的API来合并样式和源影像。 令人印象深刻的影像样式转移辅助工具。
▌Fast Text
FastText 是一个有效学习单词意思和句子进行分类的库。
为了更好地了解这个工程项目,请转到他们的文本进行分类教程,该教程展示了怎样在监督学习中使用该库。 文本进行分类的目标是将文档(例如电子邮件,帖子,文本消息,产品评论等)分配给一个或多个类别。
▌AirSim
AirSim 是一款基于 Unreal Engine 的舰载,汽车的辅助工具包。 它是开放源码的,跨互联网平台的,它支持硬件在环,并支持市面上流行的飞行控制器(如 PX4 )用于物理和视觉逼真的模拟。 这是一个 Unreal 插件,可以简单地插入到你想要的任何 Unreal 的环境中。
▌Image restoration
机器学习可以做的比我们想象的要多。 Deep Image Prior 是基于神经互联网的修复影像辅助工具 – 并不是机器学习。
此辅助工具可以恢复正常带有划痕、坏点和/或不需要的文本标记的损坏影像。
▌Open Pose
Open Pose 代表了第一个在单个影像上联合检验消化系统、手、脸部和足部突破点(总共 135 个突破点)的实时多人系统。
▌PirateAT
PirateAI 在模拟环境(岛屿)中训练自主代理(海盗)。 这个仓库运转一个训练管道,在格斗游戏(寻找宝藏)和模型训练课程( Keras + hyperopt )之间交替。
▌EmojiIntelligence
与此列表中的许多工程项目相比,这个工程项目相当简单,但它是学习神经互联网怎样工作的良好起点。 工程项目实现是在没有任何库的纯 Swift 中,并且很容易模仿。
▌Deep Exemplar-Based Colorization
它是第一个使用深度学习的基于样本的局部着色辅助工具。 给定参考的彩色影像后,我们的卷积神经互联网直接将位图影像映射到输出彩色影像。 这是基于 Deep Exemplar-based Colorization 论文的实现。