当今世界上最小和曝光率最低的资料库是别的, Access资料库究竟名列啥位呢?Access名列持续走高!
升级换代的Oceanbase TiDB资料库 TDSQL 都极好,但惟有亚洲地区资料库名列都是以欧美国家统计数据为依据,我国为何不弄两个他们的资料库名列?
依照资料库中文网站 DB-Engines 7月新一代名列表明,名列第1位的,却是ORACLE资料库,而Access资料库名列大部份资料库的第9位,名列关系资料库的第6位。名列却是十分高的。
DB-Engines Ranking 依照资料库信息系统的畅销某种程度对它展开名列。该榜单是按搜寻、Google态势、 Stack Overflow 中文网站、LinkedIn、Twitter
再补足下升级换代资料库的名列
从下面名列图中他们辨认出
一、金文却是第三
那么十多年,尽管Oracle资料库被其它资料库急速霸占,还瘦死的whole弯果,仍然名列第三位。
在2022年7月,金文(Oracle)以1280.30的平均分,名列第三,但其罚球较上月上升了7.74分。
二、MySQL名列第三,Google的SQL Server名列第三
金文母公司的开放源码资料库MySQL名列第三,Google的SQL Server名列第三。另两个开放源码资料库PostgreSQL名列第三,它也是前二周盛行度上升最慢的资料库,但7月罚球稍有上升。而第三名MySQL下月一来月稍有上升。
我常见的Mysql SqlServer都在前十强。
三、Access资料库名列大部份资料库的第9位,关系资料库的第6位
尽管各种声音急速宣告Access在走下坡路,已经快要淘汰,没有人使用它了,但统计数据说明一切,Access统计数据一直都在前10名左右,尽管无法回到2012当年最风光的时刻,但今年还从去年同期的11位还爬到了第9位,持续走高。足以说明一切,我用Access, 我骄傲!
Access在6月,7月均有上升,而且上升还有些猛。
四、约20家升级换代资料库上榜
在这份榜单上,部分升级换代资料库如创业公司PingCAP的TiDB资料库 ,Apache Kylin 涛思统计数据的TDengine 腾讯云的TDSQL 巨杉资料库的SequoiaDB 人大金仓的KingBase 易鲸捷的EsgynDB 均榜上有名
阿里云有七个资料库上榜,分别是MaxCompute ,AnalyticDB ,ApsaraDB ,Log Service ,AnalyticDB ,Table Store ,TSDB 也榜上有名。不过升级换代资料库大多在200名以外,不过,DB-Engines是依照欧美国家中文网站展开的盛行度计分,并不能真正反映我国资料库的情况。 升级换代资料库可看看升级换代资料库名列表。
五、亚洲地区资料库盛行度态势
六、资料库的分类
以下内容主要摘自:花开半夏
1、资料库的分类
结构化与非结构化统计数据
简单而言,可以用二维表来表示的就是结构化统计数据(如,包含有不同字段的一条记录);
相反,不方便用二维逻辑表来表现的统计数据,如文本、图片、视频、XML、HTML、图像和音频就是非结构化统计数据。此外,字段可依照需要扩充,即字段数目不定的,可称为半结构化统计数据。
关系型资料库就是由二维表及其之间的联系所组成的两个统计数据集。
可以这样理解
1、如果统计数据集(资料库)是关系型,那么统计数据一定是结构化的
2、相反如果统计数据是结构化,那么组成的统计数据集可能是关系型。
3、关系型资料库的最小特点就是事务的一致性。
传统的关系型资料库读写操作都是事务的,具有ACID的特点,如银行系统 保险系统。但在互联网应用中,一致性却不是显得那么重要。两个人看到同一好友的统计数据更新的时间差几秒是可以容忍的。
因此,关系型资料库的最小特点在互联网时代已经不那么重要了。
依照早期的资料库理论,常见的资料库模型有三种:分层资料库、网格资料库和关系资料库。 在当今互联网中,最常见的资料库模型主要有两种: SQL关系资料库和NoSQL非关系资料库。
2、关系型资料库介绍
关系资料库前十名包括:
1)关系型资料库的由来
资料库发展的早期,几乎都是集中式的关系型资料库的天下,如商业型统计数据库ORACLE、SQL Server、IBM DB2、Sybase等,尤其是ORACLE,几乎占到了大型资料库大部分市场份额的70%以上,这也是为何“去IOE”(IBM的小型机、Oracle的资料库、EMC的存储)工作中去O最难的原因。
后来发展起来的开放源码资料库有MySQL、PostgreSQL。MySQL使用用户群十分广 ,但也是金文的母公司产品,互联网行业大厂如Google、FaceBook、阿里、腾讯、京东 及国内电信 银行、联通、移动等国资企业,都有大规模应用MySQL。PostgreSQL主要在GIS领域处于优势地位,有丰富的GIS统计数据类型和处理算法。
网格资料库和层次资料库很好地解决了统计数据集中和共享的问题,但资料库的独立性和抽象水平存在很大缺点。 如果用户访问两个资料库,则必须明确统计数据的存储结构并指示访问路径。 关系资料库可以很好地解决这些问题。
2)关系型资料库介绍
关系资料库模型将复杂的统计数据结构组合为简单的二元关系,即二维表格式。 在关系资料库中,对统计数据的大多数操作都构建在两个或多个关系表中,通过分类、联接、连接或选择这些相关表等操作来管理资料库。
关系资料库问世40十多年来,从理论诞生发展到现实产品,如金文和MySQL,金文在资料库领域称霸,形成了两个年达数百亿美元的巨大产业市场。
传统关系资料库: Oracle、MySQL、Microsoft SQL Server、PostgreSQL
大统计数据常规资料库: Hive、Impala、Presto、ClickHouse
3、非关系型资料库介绍
1)非关系型资料库诞生背景
NoSQL是指非关系资料库。 随着互联网web2.0中文网站的兴起,传统的关系资料库在应对web2.0中文网站,特别是超大规模、高并发的SNS类型web2.0纯动态中文网站方面力不从心(小辣椒高效Office),暴露出许多难以克服的问题,但非关系资料库NoSql资料库的效率和性能在某些情况下难以想象,是传统关系资料库的有效补足。
早就有人指出,noSQL(noSQL=notonlySQL )是一场新的资料库革命运动,“不仅仅是SQL”,到了2009年态势会越来越高。 NoSQL的cjdxf们提倡利用非关系型统计数据存储,对于利用关系资料库这一铺天盖地的应用,这一概念无疑是一种新的思维方式。 它些资料库大部分都是开放源码的,可谓百花齐放百家争鸣,常见的产品很多。
2)非关系型资料库种类
(1)键值(Key-Value)存储资料库
键值资料库类似于传统语言中使用的哈希表。 可以使用key添加、查询或删除资料库。 使用key主键展开访问,可以获得高性能和可扩展性。
键值资料库主要使用哈希表。 此表有特定的键和指针,指向特定的统计数据。 Key/value机型对IT系统的好处是简单、易于部署和高度并发。
典型产品: Memcached、Redis、Ehcache
(2)列存储(Column-oriented)资料库
列存储资料库将统计数据存储在列族中。 两个列族存储经常一起查询的相关统计数据,例如人。 他们经常查询某人的名字和年龄,而不是工资。 在这种情况下,姓名和年龄放在两个列族中,工资放在另一列族中。
此类资料库通常见于支持分布式存储的大容量统计数据。
典型产品: cassandra(AP )、hbase () CP ) ) )。
(3)面向文档(Document-Oriented)资料库
文档类型资料库的灵感来自Lotus Notes办公室软件,与第三个键值资料库相似。 这种类型的统计数据模型是版本化文档,半结构化文档以特定格式存储,如JSON。 文档类型资料库可以视为键值资料库的升级版,并可以在它之间嵌套键值。 此外,文档类型资料库比键值资料库的查询效率更高。
文档资料库将统计数据存储为文档。 每个文档都是两个独立的统计数据单元,是一组统计数据项的集合。 每天
个统计数据项都有两个名词与对应值,值既可以是简单的统计数据类型,如字符串、数字和日期等;也可以是复杂的类型,如有序列表和关联对象。统计数据存储的最小单位是文档,同两个表中存储的文档属性可以是不同的,统计数据可以使用XML、JSON或JSONB等多种形式存储。
典型产品:MongoDB、CouchDB
(4)图形资料库
图形资料库允许他们将统计数据以图的方式存储。实体会被作为顶点,而实体之间的关系则会被作为边。比如他们有三个实体,Steve Jobs、Apple和Next,则会有两个“Founded by”的边将Apple和Next连接到Steve Jobs。
典型产品:Neo4J、InforGrid
(5)时序资料库
2017年时序资料库忽然火了起来。开年2月Facebook开放源码了beringei时序资料库;到了4月基于PostgreSQL打造的时序资料库TimeScaleDB也开放源码了,而早在2016年7月,百度云在其天工物联网平台上发布了国内首个多租户的分布式时序统计数据库产品TSDB,成为支持其发展制造,交通,能源,智慧城市等产业领域的核心产品,同时也成为百度战略发展产业物联网的标志性事件。时序资料库作为物联网方向两个十分重要的服务,业界的频频发声,正说明各家企业已经迫不及待的拥抱物联网时代的到来。
时序统计数据是基于时间的一系列的统计数据。在有时间的坐标中将这些统计数据点连成线,往过去看可以做成多纬度报表,揭示其态势性、规律性、异常性;往未来看可以做大统计数据分析,机器学习,实现预测和预警。
时序资料库就是存放时序统计数据的资料库,并且需要支持时序统计数据的快速写入、持久化、多纬度的聚合查询等基本功能。
对比传统资料库仅仅记录了统计数据的当前值,时序资料库则记录了大部份的历史统计数据。同时时序数据的查询也总是会带上时间作为过滤条件。
典型产品:InfluxDB、Prometheus(普罗米修斯)、OpenTSDB(底层基于HBase)
(6)搜寻引擎存储
搜寻引擎存储:搜寻引擎资料库最近比较火的包括Solr和Elasticsearch等。Solr是Apache 的两个开放源码项目,基于业界大名鼎鼎的java开放源码搜寻引擎Lucene。在过去的十年里,solr发展壮大,拥有广泛的用户群体。solr提供分布式索引、分片、副本集、负载均衡和自动故障转移和恢复功能。如果正确部署,良好管理,solr就能够成为两个高可靠、可扩展和高容错的搜寻引擎。
Elasticsearch构建在Apache Lucene库之上,同是开放源码搜寻引擎。Elasticsearch在Solr推出几年后才面世的,通过REST和schema-free的JSON文档提供分布式、多租户全文搜寻引擎。并且官方提供Java,Groovy,PHP,Ruby,Perl,Python,.NET和Javascript客户端。目前Elasticsearch与Logstash和Kibana配合,部署成日志采集和分析,简称ELK,它都是开放源码软件。最近新增了两个FileBeat,它是两个轻量级的日志收集处理工具(Agent),Filebeat占用资源少,适合于在各个服务器上搜集日志后传输给Logstash。
典型产品:Elasticsearch、Solr
(7)、新式关系型资料库(NewSQL ):
NewSQL提供与NoSQL系统相同的扩展性能,且保持传统资料库支持的ACID特性。典型代表:SAP HANA,VoltDB,nuoDB,MariaDB,Pivotal
(8)、MPP(Massively Parallel Processing)资料库:
指使用多个SQL资料库节点搭建的统计数据仓库系统,MPP解决了单个SQL资料库不能存放海量统计数据的问题。代表产品有Teradata,Vertica,Redshift,Greenplum
七、DB-Engines Ranking的平均分计算方法
DB-Engines Ranking 是两个资料库信息系统排行列表,按其当前畅销某种程度展开名列。他们使用以下参数来衡量系统的畅销某种程度:
中文网站上系统的提及次数,以搜寻引擎查询中的结果数来衡量。目前,他们使用Google和Bing展开此测量。为了只计算相关结果,他们搜寻<system name> 以及术语资料库,例如“Oracle”和“database”。对系统的普遍兴趣。 对于此测量,他们使用Google 态势中的搜寻频率。关于系统的技术讨论频率。 他们使用著名的 IT 相关问答中文网站Stack Overflow和DBA Stack Exchange上(tmtony)相关问题的数量和感兴趣的用户数量。工作机会的数量,其中提到了系统。 他们使用领先的工作搜寻引擎Indeed和Simply Hired上的报价数量。专业网络中的配置文件数量,其中提到了系统。 他们使用国际上最盛行的专业网络LinkedIn。社交网络中的相关性。他们计算了Twitter推文的数量,其中提到了该系统。他们通过对各个参数展开标准化和平均来计算系统的盛行度值(小辣椒高效Office)。这些数学变换以某种方式展开,以便保留各个系统的距离。这意味着,当系统 A 在 DB-Engines Ranking 中的值是系统 B 的两倍时,那么在单个评估标准上展开平均时,它的畅销某种程度是两倍。
为了消除统计数据源本身数量变化带来的影响,盛行度平均分始终是两个相对值,只能与其他系统展开比较来解释。
DB-Engines 名列不衡量系统的安装数量,或它在 IT 系统中的使用。可以预期,由 DB-Engines 名列衡量的系统畅销某种程度的增加(例如在讨论或工作机会中)在系统的相应广泛使用之前某个时间因素。因此,DB-Engines Ranking 可以作为早期指标。
大家都在使用什么喜欢的资料库,可以在评论区留言。或你对此名列有什么异议,也可发表意见!