概要镜像:http://tecdat.cn/?p=31035
管理工具是Android的工程项目,把同两类机能的Android标识符的颈部,每两个文档都有import 包名。把大部份import的包名都抓了留下来存入了mysql, 这是管理工具 , 须要用r预测那些包名。
用r给那些包做统计统计数据,撞名的扁枝啥,占百分之十啥,做建模图,打条码。
那个工程项目地目地是,比如说两类机能是发email的app,每两个工程项目里java文档颈部都有提及的包名,透过把大部份的包名一预测,辨认出80%的工程项目里头都有同两个包,所以就指出那个包的机能是email , 接着再透过条码关连java文档 。
引入统计数据
画灰阶表明加减重叠率
略去没多次重复的包
转换统计数据
排序出重复率
画developments
那个是git上的工程项目,每两个点是两个工程项目,相同色调则表示相同词汇,每一点间有线电视连着,则表示每一工程项目地联络,可能将是高度关注人那样,也可能将是译者那样 。当把包名挂上条码后,有可能将相同包名是两个条码,所以就能Longpr此种联络图。
对图展开删去,略去相连少的边
用developments建模
大部份统计数据:
以chat为基地:
以email为基地:
相关视频
Kmeans算法控制点
控制点数为3,将统计数据聚成3个类别
相关视频
建模控制点结果
