机器学习框架从开源走向融合

机器自学架构如PyTorch和TensorFlow的产业发展，发生改变了机器自学技师商品研制的路子和方式。

“从某种程度上说，这是两个冲破，让研制速率比从前快了两三个量级。”PyTorch创办人Soumith Chintala在赞扬机器自学架构的作用时表示。

近地点新浪网智能县丞，全面性机械故障修理，气田钻探远距全力支持，银行诈欺风险智能推论，风险较高使用者自动检测，消化系统恶性肿瘤智能检查和之类，目前，人工智慧化特别是机器自学正在发生改变世界，大批的机器自学应用领域让人们的组织工作和生活智能化。

同时，机器自学也让从前基本上难以实现的组织工作，显得低头亦然，让高高在上的智能化破冰。

好景不长广度自学在2012年再次占有优势地位年来，许多机器自学架构争相成为研究相关人员和专业人士的宠儿。机器自学架构也从开放源码起跑，创举一片片花城。

机器自学架构产业发展的五大“关键字”在人工智慧化黄金时代，机器自学架构下接晶片，上承各种应用领域，被称作是“智能黄金时代的作业系统”。在机器学习中，一般经过统计数据搜集、特点工程建设、数学模型建立、数学模型体能训练、数学模型校正等期，它是两个王奶贵循环式的工程建设，直至获得令人满意的数学模型，并在制造自然环境中布署数学模型，在制造中通过统计数据提供服务项目。机器自学架构就是协助机器自学技师，加速地合作开发商品和构筑演算法，并保证其可信、加速和成规模地组织工作。中国HANA发现，2020年年来，机器自学中的广度自学架构在产业发展上呈现五大趋势：其一开放源码。软件开放源码创举了作业系统Linux和安卓，创举了NoSQL统计数据库和关系型统计数据库MySQL，创举了消息中间件，创举云原生技术中的容器等。同样，开放源码创举了AI和机器自学。基本上有名的机器自学架构都开放源码了，也通过开放源码不断产业发展壮大。创建开放源码机器自学平台H2O的H2O.ai的创办人兼CEO Sri Ambati就认为，人工智慧化软件库和演算法都免费提供给合作开发相关人员和企业家，使企业能够更容易地尝试人工智慧化，并建立对人工智慧化技术更大的信任，这是开放源码人工智慧化和机器自学架构产业发展的根本动力。另外，开放源码机器自学架构培养了”开放源码”文化，使企业有更大的自由与开放源码社区一起创新，并利用同行的想法将机器自学嵌入到其业务中。相比之下，封闭式机器自学应用领域合作开发方法往往会抑制增长。它无助于创建反馈循环式、解决问题和改进商品、促进急需的人工智慧化人才的产业发展，也难以激发对人工智慧化数学模型和预测的信任。围绕人工智慧化和机器自学的开放源码社区可以通过减少高许可费、共享相关成果，减少对人才的需求等更快的实现目标。开放源码人工智慧化社区产业发展的社区思维，将平衡小组织、大组织、社区之间的力量对比，让每一种组织都可以享受AI的好处。二是结合。PyTorch是当今世界上最受欢迎的机器自学架构，而TensorFlow则是最流行的Ml架构。这两个开放源码的机器自学架构，分别由Facebook和谷歌提供并开放源码的，分别拥有各自的拥戴者，但也不可避免的有互补关系。

机器学习框架从开源走向融合

PyTorch创办人Soumith Chintala就预言，机器自学框架将迈向大结合。市场上出现大批的机器自学架构，如PyTorch和TensorFlow。Chintala认为：“目前架构的结合过程已经开始。之所以现在架构推出了量化功能，以及其他一系列较低层级的工具，是因为下一场战争是架构的编译器之争，比如XLA、TVM，以及PyTorch的Glow。在接下来的几年中，广度自学架构的焦点将是如何更智能地实现量化，如何更好地促进架构间的结合，如何更有效地使用GPU，如何为新硬件进行自动编译等。”在使用者的实际应用领域中，一些ML架构也被结合起来用。如TensorFlow与Keras就是两个强大的组合。对于两个普通的ML专业人士来说，TensorFlow的初始版本很难自学和实现。它被认为是两个科学计算工具包，与处理极端并行性和高性能计算的研究项目保持一致。TensorFlow和Keras的完美结合为构筑复杂的广度自学数学模型提供了动力和简单性。使用TensorFlow 2.0，工具包采用了流行的Keras架构，Keras以其简单和直观的方法而闻名。据悉，Keras的创办人François Chollet后来加入谷歌，之后谷歌就推出了TensorFlow。三是竞技场。机器自学架构开放源码、结合，但是依然存在竞争。同场竞技是目前机器自学架构市场的主流声音。一家研究机构的统计数据显示，虽然TensorFlow和PyTorch是目前使用最多和最流行的机器自学架构，各自市场份额也互有涨跌，但是其他机器自学架构所占比例依然高达35～40%。在2020年第两个月的统计数据看，大约23%的学术论文使用TensorFlow，但到了2020年12月，这一数字已经下降到11%。有人认为，机器自学架构竞争的背后，是为机器自学提供服务项目全力支持的开放源码服务项目商和其发行的商业版，同时也会给机器自学架构云服务项目商带来商业利益。无利不起早，机器自学架构依然是两个创造价值的技术市场。

机器自学架构五大“势力”如前文所言，机器自学架构层出不穷，不同的技术集团推出自己的架构。从早期的学术成果Caffe、Theano，到获得庞大工业全力支持的 PyTorch、TensorFlow等。

机器学习框架从开源走向融合

市场上的机器自学架构中国HANA认为，从机器自学架构的使用量以及商品更新的程度来看，机器自学架构出现了五大力量，分别代表不同的阵营。TensorFlow由谷歌团队合作开发，于2015 年发布。TensorFlow是两个使用统计数据流图进行数值运算的开放源码软件库，它实现了统计数据流图，其中，张量（“tensors”）可由一系列图形描述的演算法来处理，统计数据在该系统中的变化被称作“流”。统计数据流可用C++或Python编码后在CPU或GPU的设备上运行。目前，Tensorflow已经进入了2.x版黄金时代。TensorFlow 1和TensorFlow 2.x之间不同包括：新推出的Tensorflow.js.，可以使用Node在浏览器中运行现有的pyThon数学模型、再次体能训练现有的数学模型，并使用Javascript完全构筑和体能训练数学模型，却不需要pyThon。轻量级库Tensorflow Lite，则用于在移动和嵌入式设备上布署数学模型，可将现有数学模型转换为“compressed flat buffer”，将buffer加载到移动设备或任何其他嵌入式设备上。新发布的Tensorflow Extended（TFX），用于布署制造ML pipeline的端到端平台，并在web应用领域程序、移动应用领域程序和制造管理方面表现出色。TFX可以应对经典的软件制造挑战，如可扩展性、可维护性和模块化，还可以协助解决机器自学的特定挑战，如持续新浪网自学、统计数据校正、统计数据管理等。而PyTorch则由Facebook的团队合作开发，并于2017年在GitHub上开放源码。Torch是纽约大学与Facebook的开放源码机器自学库、科学计算架构和基于Lua编程语言的脚本语言。它提供了广泛的广度自学演算法，被Facebook、IBM、Yandex和其他公司用于解决统计数据流的硬件问题。之后，在Torch基础之上，Facebook研制开放源码了PyTorch，并在学术研究中广受欢迎。PyTorch采用了被已为研究、合作开发和统计数据科学家所熟悉的Python命令式编程风格。Facebook主导的开放源码机器自学架构PyTorch已经推出了1.8版。与Tensorflow Lite相似，PyTorch改进了其现有的Pytorch Mobile。该架构可以量化、跟踪、优化和保存适用于Android和iOS的数学模型。新的发布Pytorch Lite Interpreter的原型可减小移动设备上二进制运行时的大小。Pytorch Profiler用于分析APP、数学模型的执行时间、执行流程、内存消耗等。开放源码世界很精彩，但是开放源码世界依然存在限制使用、下载等风险。因此，在开放源码软件托管还是机器自学架构托管方面，国产系统依然的两个产业发展方向。今年3月，我国首个自主研制、功能完备、开放源码开放的产业级广度自学架构飞桨发布了 2.0 正式版，可以说是一次“基础设施”的更新换代距离飞桨开放源码架构2.0版本发布刚过去两个月，5月20日，百度发布了新的飞桨开放源码架构 2.1 版本，同时飞桨企业版也有新升级。百度首席技术官、广度自学技术及应用领域国家工程建设实验室主任王海峰介绍，飞桨已凝聚320万合作开发者，相比一年前增加近70%；服务项目的企事业单位达到12万家。飞桨开放源码架构V2.1版集自动混合精度优化、动态图功能增强、高层API、自定义OP功能优化四大技术亮点于一身，启动后可将体能训练速率提升3倍，即时执行效率提升11%。通过这些技术升级，飞桨开放源码架构V2.1版将打造更开放、更具扩展性的演算法平台。

好用基础上机器自学架构的五大“看点”机器自学架构的核心目的是协助机器自学技师破冰数学模型和演算法，提高效率，降低成本。因此，机器自学架构必须得从能用，向好用产业发展，在机器自学螺旋式产业发展中，造就新的竞争力。中国HANA观察，机器自学架构在产业发展有五大看点，不容忽视。其一平台与晶片软硬一体结合创新。从平台的角度，机器自学架构中平台与晶片软硬一体结合创新，满足算力、功耗、时延等的多样化需求，让机器自学取得最佳的应用领域效果。如TensorFlow是可用于运行从云到最微小的微控制器设备的机器自学数学模型的架构。使用 TensorFlow体能训练的数学模型可以针对CPU和GPU进行优化，从x86到ARM64。使用TensorFlow精简版，相同型号可以针对手机、物联网设备和边缘计算自然环境。这使得它有可能体能训练数学模型一次，并将其布署到Android手机和更多的微控制器上。飞桨针对多种晶片并存的自然环境，研制了异构参数服务项目器体能训练技术，冲破了超大数学模型的高效体能训练难题。据介绍，截至2021年5月，飞桨硬件生态与22家国内外硬件厂商开展适配和联合优化，已完成和正在适配的晶片或IP达到31款。英特尔、英伟达、Arm等国际晶片大厂均主动在开放源码社区为飞桨贡献代码。飞桨也同飞腾、申威、海光、鲲鹏、龙芯、兆芯、等国产CPU进行深入结合适配，并结合麒麟、统信、普华作业系统，以及百度昆仑、海光DCU、寒武纪、华为昇腾、比特大陆、登临、瑞芯微、高通、苹果、联发科等AI晶片广度结合。让ML架构成为云计算的一部分。目前，大多数的公有云服务项目商已经将ML作为企业业务增长的主要方向，因此在云上全力支持开放源码的机器自学架构，或者全力支持机器自学架构的商业版，成为两个趋势和方向。TensorFlow是主流公有云管理ML PaaS 的一部分，是公有云平台不可分割的一部分。它为计算机视觉、自然语言处理、个性化和推荐服务项目等应用领域提供API。主流机器自学平台作为一种服务项目（MLaaS）品对TensorFlow有着广泛的全力支持。亚马逊云服务项目、Azure ML、谷歌AI平台、IBM沃森机器自学、阿里云等均将在其平台上紧密的集成TensorFlow。

机器学习框架从开源走向融合

AWS CEO Andy Jassy2019年演讲在AWS re:Invent 2019 上，AWS CEO Andy Jassy声称，在应用领域最多的机器自学架构方面，85%的TensorFlow使用者在云上的组织工作负载都运行在亚马逊云科技上，而到了2020年，这一数字达到92%。同时，91%的PyTorch在云上的组织工作负载都跑在亚马逊云科技，在云上面进行机器自学已经是非常成熟的选择。研制集团的支持与降低应用领域门槛同步同进。目前来看，不管是那种机器自学架构，在依靠开放源码社区的基础上，依然有强大的机构研制力量的全力支持。TensorFlow是谷歌的关键项目。谷歌已投入数百万美元用于研制，以推进机器自学，并将这些能力带到TensorFlow。谷歌正在利用TensorFlow为其许多商品和服务项目，包括谷歌助手、安卓等服务项目。在今年上半年，Facebook联手微软宣布推出PyTorch企业全力支持计划，该计划使服务提供商能够为其客户合作开发和提供定制的企业级全力支持。Facebook与微软合作建立的新商品是根据PyTorch企业使用者在制造中为关键任务应用领域合作开发数学模型的反馈而创建的。另两个机器自学架构Azure ML Studio允许微软Azure的使用者创建和体能训练数学模型，随后将这些数学模型转化为能被其他服务项目使用的API。在Azure中有大批的演算法可供使用。飞桨一直致力于降低使用者使用的门槛，既有全力支持动静统一的核心架构，也有产业级数学模型库、合作开发套件和工具组件，以及提高企业制造效率的飞桨企业版等，满足不一样行业、不一样期、不一样层次合作开发者的需要。使用门槛的下降，比如会加快人工智慧化应用领域的多样化和规模化，加快了产业智能化的进程。

机器学习框架从开源走向融合