现如今自学应用领域统计数据建模的平台有许多,你可以追踪一些研究者网志,但更重要的一点儿是课堂教学/Jalgaon,你要对目前需用的统计数据建模辅助工具有位大体介绍。
上面列出的十个统计数据建模辅助工具,不论你是预备制做单纯的图象还是繁杂的图象或是重要信息图,那些辅助工具都能满足用户你的须要。更为奇妙的是,那些辅助工具多半完全免费。
紧凑型辅助工具
Excel
Excel的GUI机能并不强悍,但Excel看似预测统计数据的平庸辅助工具,左图是Excel聚合的蒸气世界地图。
做为两个紧凑型辅助工具,Excel是加速预测统计数据的平庸辅助工具,也能建立供外部采用的统计数据图,但是Excel在色调、轮廓和式样上可选择的覆盖范围非常有限,这也意味著用Excel极难制做出可合乎专精印刷品和中文网站须要的统计数据图。
不过做为两个高效率的外部沟通交流辅助工具,Excel应是你要解中必不可少的辅助工具众所周知。
CSV/JSON
CSV(双引号隔开值)和JSON(JavaScript第一类注解)虽然并不是或者说的建模辅助工具,但看似常用的统计数据库系统。
你要认知他们的内部结构,并懂怎样从那些文档中引入或是求出统计数据。
下列即将如是说的大部份统计数据建模辅助工具都全力支持CSV、JSON中最少一种文档格式。
Google Chart API
Google Chart API工具集中取消了静态图片机能,目前只提供动态图象辅助工具。
能够在大部份全力支持SVG\Canvas和VML的浏览器中采用,但是Google Chart的两个大问题是:图象在客户端聚合,这意味著那些不全力支持JavaScript的设备将无法采用,此外也无法离线采用或是将结果另存其他文档格式,之前的静态图片就不存在这个问题。
尽管存在上述问题,不可否认的是Google Chart API的机能异常丰富,如果没有特别的定制化需要,或是对Google视觉风格的抵触,那么你大可以从Google Chart开始。
Flot
Flot是两个杰出的线框图象库,全力支持大部份全力支持canvas的浏览器(目前主流的浏览器如火狐、IE、Chrome等都全力支持)。
Raphael
Raphael是建立图象和图形的JavaScript库,与其他库最大的不同是输出文档格式仅限SVG和VML。
SVG是矢量文档格式,在任何分辨率下的显示效果都很好。
D3
D3(Data Driven Documents)是全力支持SVG渲染的另一种JavaScript库。
D3能够提供大量线性图和条形图之外的繁杂图象式样,例如Voronoi图、树形图、圆形集群和单词云等。
虽然D3能够提供非常花哨的互动图象,但你在选择统计数据建模辅助工具时,须要牢记的一点儿是:知道在何时保持简洁。
Visual.ly
如果你须要制做重要信息图而不仅仅是统计数据建模,目前也有大把的辅助工具需用。
Visual.ly就是最流行的两个选择。虽然Visual.ly的主要定位是:“重要信息图设计师的在线集市”,但是也提供了大量重要信息图模板。虽然机能还有许多限制,但是Visual.ly绝对是个能激发你灵感的地方。
互动图形用户界面(GUI)控制
如果统计数据建模的互动性强悍到可以做为GUI界面会怎样?
随着在线统计数据建模的发展,按钮、下拉列表和滑块都在进化成更为繁杂的界面元素,例如能够调整统计数据覆盖范围的互动图形元素,推拉那些图形元素时输入参数和输出结果统计数据会同步改变。
在这种情况下,图形控制和内容已经合为一体。下列那些辅助工具能够帮你实现那些机能:
Crossfilter
当我们为方便客户浏览统计数据开发出更为繁杂的辅助工具时,我们已经能够建立出既是图象,又是互动图形用户界面的小程序。JavaScript库Crossfilter就是这样的辅助工具。
Crossfilter应用领域:当你调整两个图象中的输入覆盖范围时,其他关联图象的统计数据也会随之改变。
Tangle
JavaScript库Tangle进一步模糊了内容与控制之间的界限。
在左图的应用领域实例中,Tangle聚合了两个负载的互动方程,读者可以调整输入值获得相应统计数据。
世界地图辅助工具
世界地图聚合是web上最困难的任务众所周知。Google Maps的出现完全颠覆了过去人们对在线世界地图机能的认识。而Google发布的Maps API则让大部份的开发者都能在自己的中文网站中植入世界地图机能。
近年来,在线世界地图的市场成熟了许多,如果你须要在统计数据建模项目中植入定制化的世界地图方案,目前市场上已经有许多选择,但是知道在何时选择何种世界地图方案则成了两个很关键的业务决策。
世界地图方案看上去机能都很强悍,但是切忌:“有了一把锤子,看什么都像钉子”
Modest Maps
顾名思义,Modest Maps是两个很小的世界地图库,只有10KB大小,是目前最小的需用世界地图库。
这似乎意味著Modest Maps只提供一些基本的世界地图机能,但是不要被这一点儿迷惑了。在一些扩展库的配合下,例如Wax,Modest Maps立刻会变成两个强悍的世界地图辅助工具。
Leaflet
CloudMade团队为大家带来了Leaflet,这是另外两个小型化的世界地图框架,通过小型化和轻量化来满足用户移动网页的须要。
Leaflet和Modest Maps都是开源项目,有强悍的社区全力支持,是在中文网站中整合世界地图应用领域的平庸选择。
PolyMaps
Polymaps是另外两个世界地图库,但主要面向统计数据建模用户。
Polymaps在世界地图风格化方面有独到之处,类似CSS式样表的选择器,是不可错过的好东西。
OpenLayers
OpenLayers可能是大部份世界地图库中可靠性最高的两个。
虽然文档注解并不完善,且自学曲线非常陡峭,但是对于一些特定的任务来说,OpenLayers无可匹敌。例如能够提供一些其他世界地图库都没有的特殊辅助工具。
Kartograph
Kartograph的标记线是对世界地图绘制的重新思考,我们都已经习惯了莫卡托投影,但是Kartograph为我们带来了更多的选择。
如果你不须要调用全球统计数据,而仅仅是聚合某一区域的世界地图,那么Kartogaph将使你脱颖而出。
CartoDB
CartoDB是两个不可错过的中文网站。你可以用CartoDB很轻易就把表格统计数据和世界地图关联起来,这方面CartoDB是最杰出的选择。
例如,你可以输入CSV通讯地址文档,CartDB能将地址字符串自动转化成经度/维度统计数据并在世界地图上标记出来。目前CartoDB全力支持免费聚合五张世界地图统计数据表,更多采用须要支付月费。
随着高清移动设备的普及,web开发的两个最新趋势是将符号字体与字体整合(把符号变成字体),建立出漂亮的矢量化图标。
在那些新型字体中,例如FF Chartwell和Chartjunk是专门用来显示图象和图形的。
他们与OpenType碰到的问题一样,就是不能被大部份的浏览器全力支持,但是不久的未来那些矢量字体将是统计数据建模工作中须要考虑到的因素。
进阶辅助工具
如果你预备用统计数据建模做一些“严肃”的工作,那么你可能不会对在线建模辅助工具或是web小程序有太大兴趣,你须要的是桌面应用领域和编程环境。
Processing
Processing是统计数据建模的招牌辅助工具。你只须要编写一些单纯的代码,然后编译成Java。
目前还有两个Processing.js项目,可以让中文网站在没有Java Applets的情况下更容易地采用Processing。
由于端口全力支持Objective-C,你也可以在iOS上采用Processing。
虽然Processing是两个桌面应用领域,但也可以在几乎大部份平台上运行,此外经过数年发展,Processing社区目前已经拥有大量实例和代码。
NodeBox
NodeBox是OS X上建立二维图形和建模的应用领域程序。
你须要介绍Python程序,NodeBox与Processing类似,但是没有Processing的互动机能。
研究者级辅助工具
与Excel相对的是专精统计数据预测辅助工具。如果你是两个专精的统计数据预测师,那么你就要对上面即将如是说的辅助工具有所介绍(如果不是精通的话)。
众所周知,SPSS和SAS是统计数据预测行业的标准辅助工具,但是那些辅助工具的费用不菲,只有大型组织和学术机构才有机会采用。
上面我们如是说几种完全免费的替代辅助工具,那些开源辅助工具的共同特征是都有强悍的社区全力支持。开源预测辅助工具性能不输老牌专精辅助工具,插件的全力支持甚至更好。
R
做为用来预测大统计数据集的统计组件包,R是两个非常繁杂的工具,须要较长的自学课堂教学,自学曲线也是本文所如是说辅助工具中最陡峭的。
但是R拥有强悍的社区和组件库,而且还在不断成长。当你能驾驭R的时候,一切付出都是物有所值的。
Weka
当你成长成一名统计数据科学家的时候,你须要将个人能力从统计数据建模扩展到统计数据挖掘领域。
Weka是两个能根据属性分类和集群大量统计数据的杰出辅助工具,Weka不但是统计数据预测的强悍辅助工具,还能聚合一些单纯的图象。
Gephi
Gephi是进行社交图象统计数据建模分析的辅助工具,不但能处理大规模统计数据集并聚合漂亮的建模图形,还能对统计数据进行清洗和分类。
Gephi是一种非常特殊的软件,也非常繁杂,先于他人掌握Gephi将使你一骑绝尘。
快挑选几个喜欢的试试看吧,说不定用得上