Apache Flink简介

2022-12-27 0 862

一、Apache Flink概要

Apache Flink是两个对外开放源码网络平台,它是两个流报文发动机,为报文上的分布式系统计算提供更多通讯,纠错和统计数据递送。Flink是 Apache的世界顶级工程项目。它是两个可扩充的统计数据挖掘构架,与Hadoop完全相容。Flink能随心所欲执行流处置和格式化。

Apache Flink是在名叫Stratosphere的工程项目下开启的。2008年,克利福德丹尼尔(VolkerMarkl)提出了“对流层”的设想,并招揽了来自HU Berlin, TU Berlin和波兹坦Hasso Plattner Institute的其它主要就科学研究人员。他们共同致力同时实现蓝图,并已经在对外开放源码布署和系.统构建方面作出了巨大不懈努力。

后来,采取了几个关键性的关键步骤,而因工程项目能在商业性,科学研究和对外开放源码街道社区中广畅销。两个商业性虚拟将该工程项目重新命名叫“对流层”。在2014年4月提出申请Apache幼体后,Flink名 称已完稿。Flink是荷兰语单字,表示灵巧或灵巧。

二、为什么选择Flink?

Apache Flink的主要就蓝图是消除并降低其它分布式系统统计数据驱动力发动机所面临的复杂程度。这是透过将查阅强化,统计关系数据库的基本概念以及高效率的博戈达内存和Mach外演算法与MapReduce构架软件系统在一起而同时实现的。因而,ApacheFlink主要就如前所述流数学模型,ApacheFlink透过采用流统计关系数据库来插值统计数据。现在,将插值演算法的基本概念存取到Flink查阅强化器中。因而,Apache Flink的电路板统计关系数据库容许处置流统计数据的速度hondayz格式化统计关系数据库(Spark) 更快,延后更低。

三、Apache Flink的机能

低延后和高效率能

Apache Flink无须任何繁杂的实用性方可提供更多高效率能和低延后。其电路板构架可提供更多高林宏吉率。

纠错能力

Apache Flink提供更多的纠错机能如前所述Chandy-Lamport分布式系统镜像,此监督机制提供更多了强悍的连续性保证。

缓存管理工作

Apache Flink中的缓存管理工作能控制我们在某些运行时操作中采用了多少缓存。

插值

Apache Flink为插值演算法(机器学习,图像处置)提供更多了专门的支持

资源整合

我们能随心所欲地将Apache Flink与其它对外开放源码统计数据处置生态系统软件系统在一起。它能与Hadoop软件系统,从Kafka流统计数据,能在YARN上运行。

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务