物联网数据分析方法

2023-06-01 0 514

原副标题:物联网统计数据挖掘形式

在物联网的现今世界中,通过感应器创造出大量的统计数据是极其常用的,也是现今物联网所直面的考验众所周知——从数据传输的视角上看是这般,从统计数据层管理的微观上看也依然是这般。物联网设备能造成海量数据的统计数据其中众所周知的案例就是在商业性飞机制造中所布署在直升机上的感应器。

当代直升机上的喷射发动机上配有上百个感应器以保证直升机发动机的稳定运行,那些感应器每秒钟约莫能造成仅约10GB的统计数据。如下表所示图1.1右图当代飞机换装的双发动机发动机大约配有5000个左右的感应器。因此,如果两架双发动机的民用直升机平均运行时间为8小时,那么每天的统计数据Sonbhadra超过500TB,而这实际上是源自发动机的统计数据!今天的直升机有数以千计的其他感应器相连到直升机上的各足部系统。而实际上,当代的大型双发动机直升机实际上是主翼上就有1亿个感应器。

图1.1 商业性直升机的双发动机发动机

物联网数据分析方法

现今世界约有10Rieux商业性国际航班。那些源自商业性国际航空业务的直升机所造成的的物联网统计数据是不可思议。

这个实例只是为数众多物联网大统计数据问题越发严重的实例众所周知。以目前尽量有效的形式来预测那些统计数据辖下专业领域。统计数据挖掘必须能够及时处理的从统计数据中找到需用、可操作的体悟和知觉,不论统计数据的展现形式如何,不然无法充分反映出物联网的缺点。

在预测统计数据研究之前,有必要性定义统计数据相关的关键性概念。首先,绝非所有统计数据都是完全相同的;可从完全相同的视角、形式进行进行分类和预测。根据统计数据的进行分类形式,能应用各种统计数据挖掘辅助工具和处理形式。从物联网的视角上看,这两个概要是统计数据的形式化和非形式化的主要依据,以及综合评价统计数据是否处于静态还是恒定。

一、形式化统计数据或非形式化统计数据的比较

统计数据的结构是统计数据的重要进行分类,因为从预测统计数据的视角上看,它们通常需要加进完全相同的统计数据挖掘辅助工具子集。如图1.2提供了形式化和非形式化统计数据的差别较为。

图1.2统计数据形式化或非机构化的差别

物联网数据分析方法

形式化统计数据遵循这种模型/模式,该模型/模式定义了统计数据的结构的表达和组织形式,这意味着它非常适合传统的关系型统计数据管理系统(RDBMS)。

形式化统计数据能在大多数计算机系统中找到,包括从银行交易后将发票统计到计算机的日志文件和路由器的配置在内的所有内容。物联网传感统计数据通常使用形式化的值,如温度、湿度、气压等,那些数值都是已知格式发送。形式化统计数据易于格式化、存储、查询和处理;因为那些特性,它一直作为行业决策的主要统计数据类型。

非结构化的统计数据缺少通过传统编程的形式来进行解读以及解码。这种统计数据类型包括文本、语音、图形以及视频。一般来说,任何不完全符合预定义统计数据模型的统计数据都会被归类为非机构化的统计数据。

据统计,目前大约80%的业务统计数据为非形式化统计数据。正因这般,能应用于非形式化的统计数据挖掘形式相对较为复杂,如知觉计算器、机器学习、自然语言处理(NLP)和人工智能等。那些技术能从各种各样的非机构化统计数据中提取关键性信息。

目前而言,形式化统计数据相对非形式化统计数据,更容易管理和处理。熟悉这两种统计数据进行分类结构非常重要,这样才能判断使用哪一种统计数据进行分类能更加容易判断给出适宜的统计数据挖掘方案。

二、静态统计数据与静态统计数据

于大多数网络应用,物联网中的统计数据要么在“传输中”(静态统计数据),要么已经被保存或者存储(静态统计数据)。静态统计数据包括传统的客户端与服务器进行交换,比如WEB浏览器中通过网络进行数据传输的用户统计数据、电子邮件数据传输等。将统计数据保存到硬盘、USB存储器等物理硬件中的统计数据属于静态统计数据。

从物联网的视角上看,源自智能设备的统计数据通常被认为是运动统计数据,因为它是通过网络的形式最后到达到最终目的地。其采集统计数据在边缘采集后通过云计算的形式进行处理后进行上传,最终到达统计数据存储中心。

当统计数据到达统计数据中心后,统计数据中心再次将采集的统计数据进行二次处理,而处理中的统计数据仍是在移动的状态。当前,静态统计数据的预测处理辅助工具还是处理起步阶段。

在物联网网络中的静态统计数据通常能在物联网的统计数据整体或者代理网络中找到。从统计数据挖掘的视角上看,有许多辅助工具能使用,特别是对于形式化统计数据的处理辅助工具,那些辅助工具不仅能提供统计数据处理,还能提供对统计数据的存储服务。

三、物联网统计数据挖掘概述

源自智能物联网设备的统计数据通常需要经过处理筛选后的统计数据才会有实现其商业性和预测价值。统计数据挖掘通常会根据其结果进行类型预测和分解。如图1.3,统计数据挖掘的4种类型。

图1.3统计数据挖掘的4种类型

物联网数据分析方法

描述性预测:此类统计数据通过预测过描述的形式阐述此刻正在发生着什么。例如,汽车胎压中的计量器每秒钟报告一个气压值。通过那些统计数据设备使用人员可时刻监控设备的状态以保证设备安全稳定的运行。

诊断性预测:此类预测通过预测设备为何会产出统计数据的形式,清楚的了解设备运行原理,从而进行对设备问题的诊断。

预测性预测:预测性预测的目的是为了在问题发生之前进行对其预测从而达到设备稳定运行目前。例如,汽车在运行时水箱的温度不断缓慢上升,则表明汽车可能需要更换机油或者水箱需要维护。

处方性预测:处方性预测已经超越预测性预测,其可对即将到来的问题提出解决方案。就如针对水箱攀升问题进行统计数据挖掘处理的形式提出各种替代解决方案。

预测性预测和处方性预测都是资源密集型的统计数据挖掘形式,其提供的价值远远超过统计数据本身。如1.4右图为4中统计数据挖掘形式中描述预测最为简单,处方性预测最难,其中难度成梯度上升,处方性预测其提供的价值最多,但也是最为复杂的。当前物联网的统计数据挖掘大多依赖于描述性预测和诊断性预测,但是对于目前企业而言预测性预测和处方性预测的需求是迫切的。

图1.4价值和复杂性因素在统计数据挖掘类型中的应用

物联网数据分析方法

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务