一个统计数据挖掘师,在直面海量统计数据时,偶尔把自己也当做第一类去预测、思考、归纳,就可以成为一位有那么点儿味道的统计数据挖掘师,就可以不断地审视、提升预测水平,就可以在统计数据挖掘的道路上走得更远。
两本书就是译者刘丁山对过去10年统计数据挖掘生涯的反思、归纳、提炼。
以前看的统计数据挖掘书籍,很难看到国内企业的完备示例。而两本书撷取的统计数据化营运两栖作战事例都是来自阿里巴巴B2B近3年来的商业性课堂教学,有见效的事例,也有充满了磨难和反复的事例。直面那些两栖作战中的挫折和曲折,译者撷取了怎样修正路子、修正方式,怎样与销售业务方一起寻找新计划,最终怎样达成满意的商业性应用领域效用。那些撷取都十分真实世界、十分难能可贵,相信那些完备的两栖作战事例将给你全新的写作体验,还你一个真实世界清楚的有关统计数据挖掘商业性应用领域的原样,也会对听众今后的统计数据挖掘商业性课堂教学起到很好的感悟和参照作用。
所推荐序前言为何要写这两本书听众第一类第三版和全力支持怎样写作两本书致意第1章什么是统计数据化营运1.1现代营销理论的产业发展历程1.1.1从4P到4C1.1.2从4C到3P3C1.2统计数据化营运的主要就内容1.3为何要统计数据化营运1.4统计数据化营运的必要条件1.4.1虚拟化海量统计数据存储的实现1.4.2系统化营运的需求1.4.3统计数据挖掘和统计数据挖掘控制技术的有效应用领域1.4.4企业决策层的倡导与持续全力支持1.5统计数据化营运的新现象与新产业发展1.6关于网络和电子商务的最新统计数据第2章统计数据挖掘概述2.1统计数据挖掘的产业发展历史2.2统计预测与统计数据挖掘的主要就区别2.3统计数据挖掘的主要就成熟控制技术以及在统计数据化营运中的主要就应用领域2.3.1计算机程序2.3.2数学模型2.3.3回归2.3.4关连准则2.3.5控制点2.3.6可计算性进行分类方式2.3.7全力支持向量机2.3.8主成分预测2.3.9状态参数2.4网络行业统计数据挖掘应用领域的特点第3章统计数据化营运中常用的统计数据挖掘工程项目类型3.1最终目标顾客的特征预测3.2最终目标顾客的预测(响应、进行分类)数学模型3.3营运群体的活跃度定义3.4使用者路径预测3.5交叉销售数学模型3.6信息质量数学模型3.7服务保障数学模型3.8使用者(买主、商家)分层数学模型3.9商家(买主)交易数学模型3.10市场风险数学模型3.11货品所推荐数学模型3.11.1货品所推荐介绍3.11.2关连准则3.11.3协作过滤算法3.11.4货品所推荐数学模型归纳3.12统计数据产品3.13决策全力支持第4章统计数据化营运是Montagrier、跨工程项目组的协同与密切合作4.1统计数据挖掘工程项目组与销售业务工程项目组的分工和定位4.1.1明确提出销售业务预测市场需求并且能独当一面基本的统计数据挖掘4.1.2提供销售业务经验和参照建议4.1.3策划和执行系统化营运计划4.1.4跟踪营运效用、反馈和归纳4.2统计数据化营运是真正的多工程项目组、多专业的协作作业4.3示例示范数据化营运中的Montagrier、跨工程项目组协同密切合作第5章预测师常用的贡恰和未来学的沃苏什卡5.1轻视销售业务论5.2控制技术万能论5.3控制技术前端论5.4可视化与应用领域两段论5.5机器万能论5.6幸福的家庭成员都是相似的,意外的家庭成员各有各的意外第6章统计数据挖掘工程项目完备应用领域事例模拟6.1工程项目背景和销售业务预测市场需求的明确提出6.2统计数据挖掘师参与市场需求讨论6.3制定市场需求预测框架和预测计划6.4抽取样本统计数据、熟悉统计数据、统计数据清洗和清查6.5如期初步搭建挖掘数学模型6.6与销售业务方讨论数学模型的初步结论,明确提出新的路子和数学模型优化计划6.7按优化计划重新抽取样本并可视化,提炼结论并验证数学模型6.8完成预测报告和落地应用领域建议6.9制定具体的落地应用领域计划和评估计划6.10销售业务方实施落地应用领域计划并跟踪、评估效用6.11落地应用领域计划在实际效用评估后,不断修正完善6.12不同营运计划的评估、归纳和反馈6.13工程项目应用领域后的归纳和反思第7章统计数据挖掘可视化的优化和限度7.1统计数据挖掘数学模型的优化要遵循有效、适度的原则7.2怎样有效地优化数学模型7.2.1从销售业务路子上优化7.2.2从可视化的控制技术路子上优化7.2.3从可视化的控制技术技巧上优化7.3怎样思考优化的限度7.4数学模型效用评价的主要就指标体系7.4.1评价数学模型准确度和精度的系列指标7.4.2 ROC曲线7.4.3 KS值7.4.4 Lift值7.4.5数学模型稳定性的评估第8章常用的统计数据处理技巧8.1统计数据的抽取要正确反映销售业务市场需求8.2数据抽样8.3预测统计数据的规模有哪些具体的要求8.4怎样处理缺失值和异常值8.4.1缺失值的常用处理方式8.4.2异常值的判断和处理8.5统计数据转换8.5.1生成衍生变量8.5.2改善变量分布的转换8.5.3分箱转换8.5.4统计数据的标准化8.6筛选有效的输入变量8.6.1为何要筛选有效的输入变量8.6.2结合销售业务经验进行先行筛选8.6.3用线性相关性指标进行初步筛选8.6.4 R平方8.6.5卡方检验8.6.6 IV和WOE8.6.7部分可视化算法自身的筛选功能8.6.8降维的方式8.6.9最后的准则8.7共线性问题8.7.1怎样发现共线性8.7.2怎样处理共线性第9章控制点预测的典型应用领域和控制技术小窍门9.1控制点预测的典型应用领域场景9.2主要就控制点算法的进行分类9.2.1划分方式9.2.2层次方式9.2.3基于密度的方式9.2.4基于网格的方式9.3控制点预测在课堂教学应用领域中的重点注意事项9.3.1怎样处理统计数据噪声和异常值9.3.2统计数据标准化9.3.3控制点变量的少而精9.4控制点预测的扩展应用领域9.4.1控制点的核心指标与非控制点的销售业务指标相辅相成9.4.2统计数据的探索和清理工具9.4.3个性化所推荐的应用领域9.5控制点预测在实际应用领域中的优势和缺点9.6控制点预测结果的评价体系和评价指标9.6.1销售业务专家的评估9.6.2控制点控制技术上的评价指标9.7一个典型的控制点预测课题的事例撷取9.7.1事例背景9.7.2基本的统计数据清查9.7.3基于使用者样本的控制点预测的初步结论第10章预测响应(进行分类)数学模型的典型应用领域和控制技术小窍门10.1数学模型控制技术的课堂教学应用领域和注意事项10.1.1数学模型的原理和核心要素10.1.2数学模型的应用领域优势10.1.3数学模型控制技术的缺点和注意事项10.2计算机程序控制技术的课堂教学应用领域和注意事项10.2.1计算机程序的原理和核心要素10.2.2 CHAID算法10.2.3 CART算法10.2.4 ID3算法10.2.5决策树的应用领域优势10.2.6计算机程序的缺点和注意事项10.3逻辑回归控制技术的课堂教学应用领域和注意事项10.3.1逻辑回归的原理和核心要素10.3.2回归中的变量筛选方式10.3.3逻辑回归的应用领域优势10.3.4逻辑回归应用领域中的注意事项10.4多元线性回归控制技术的课堂教学应用领域和注意事项10.4.1线性回归的原理和核心要素10.4.2线性回归的应用领域优势10.4.3线性回归应用领域中的注意事项10.5数学模型的过拟合及对策10.6一个典型的预测响应数学模型的事例撷取10.6.1事例背景10.6.2基本的统计数据清查10.6.3可视化统计数据的抽取和清洗10.6.4初步的相关性检验和共线性排查10.6.5潜在自变量的分布转换10.6.6自变量的筛选10.6.7响应数学模型的搭建与优化10.6.8冠军数学模型的确定和主要就的预测结论10.6.9基于数学模型和预测结论基础上的营运计划10.6.10数学模型落地应用领域效用跟踪反馈第11章使用者特征预测的典型应用领域和控制技术小窍门11.1使用者特征预测所适用的典型销售业务场景11.1.1寻找最终目标使用者11.1.2寻找营运的抓手11.1.3使用者群体细分的依据11.1.4新品开发的线索和依据11.2使用者特征预测的典型预测路子和预测技术11.2.13种划分的区别11.2.2 RFM11.2.3控制点控制技术的应用领域11.2.4计算机程序控制技术的应用领域11.2.5预测(响应)数学模型中的核心自变量11.2.6状态参数的应用领域11.3特征提炼后的评价体系11.4使用者特征预测与使用者预测数学模型的区别和联系11.5使用者特征预测事例第12章营运效用预测的典型应用领域和控制技术小窍门12.1为何要做营运效用预测12.2统计控制技术在统计数据化营运中最重要最常用的应用领域12.2.1为何要进行状态参数12.2.2状态参数的基本思想12.2.3 T检验概述12.2.4两组独立样本T检验的假设和检验12.2.5两组独立样本的非参数检验12.2.6配对差值的T检验12.2.7配对差值的非参数检验12.2.8方差预测概述12.2.9单因素方差预测12.2.10多个样本组的非参数检验12.2.11卡方检验12.2.12控制变量的方式12.2.13 AB Test第13章漏斗数学模型和路径预测13.1网络日志和布点13.1.1日志布点13.1.2日志采集13.1.3日志解析13.1.4日志预测13.2漏斗数学模型与路径预测的主要就区别和联系13.3漏斗数学模型的主要就应用领域场景13.3.1营运过程的监控和营运效率的预测与改善13.3.2使用者关键路径预测13.3.3产品优化13.4路径预测的主要就应用领域场景13.5路径预测的主要就算法13.5.1社会网络预测方式13.5.2基于序列的关连预测13.5.3最朴素的遍历方式13.6路径预测事例的撷取13.6.1事例背景13.6.2主要就的预测控制技术介绍13.6.3预测所用的统计数据概况13.6.4主要就的统计数据结论和销售业务解说13.6.5主要就预测结论的落地应用领域跟踪第14章统计数据挖掘师对销售业务工程项目组统计数据挖掘能力的培养14.1培养销售业务工程项目组统计数据挖掘意识与能力的重要性14.2统计数据挖掘师在销售业务工程项目组统计数据挖掘意识能力培养中的作用14.3统计数据挖掘师怎样培养销售业务工程项目组的统计数据挖掘意识和能力14.4统计数据挖掘师培养销售业务工程项目组统计数据挖掘意识能力的事例撷取14.4.1事例背景14.4.2过程描述14.4.3本工程项目的效用跟踪第15章换位思考15.1为何要换位思考15.2从销售业务方的角度换位思考统计数据挖掘与挖掘15.3从同行的角度换位思考统计数据挖掘挖掘的经验教训第16章养成统计数据挖掘师的品质和思维模式16.1态度决定一切16.1.1信念16.1.2信心16.1.3热情16.1.4敬畏16.1.5感恩16.2商业性意识是核心16.2.1为何商业性意识是核心16.2.2怎样培养商业性意识16.3一个基本的方式论16.4大胆假设,小心求证16.520/80原理16.6结构化思维16.7优秀的统计数据挖掘师既要客观,又要主观第17章条条大道通罗马17.1为何会条条大道通罗马17.2条条大道有侧重17.3自觉服从和积极响应17.3.1自觉服从17.3.2积极响应17.4具体示例第18章统计数据挖掘课堂教学的质量保障流程和制度18.1一个有效的质量保障流程制度18.1.1销售业务市场需求的收集18.1.2评估小组评估市场需求的优先级18.1.3课题组的成立及前期清查18.1.4向销售业务方提交正式课题(工程项目)计划书18.1.5统计数据挖掘挖掘的课题展开18.1.6向销售业务方提交结论报告及销售业务落地应用领域建议18.1.7课题(工程项目)的落地应用领域和效用监控反馈18.2质量保障流程制度的重要性18.3怎样全力支持与强化质量保障流程制度第19章几个经典的统计数据挖掘方式论19.1 SEMMA方式论19.1.1统计数据取样19.1.2统计数据探索19.1.3统计数据修正19.1.4模式化19.1.5评价19.2 CRISP-DM方式论19.2.1销售业务理解19.2.2数据理解19.2.3统计数据准备19.2.4数学模型搭建19.2.5数学模型评估19.2.6数学模型发布19.3 Tom Khabaza的挖掘9律
下载地址:http://static.wenjiangs.com/pdf/3eaa3a9b-fd6d7a7f.zip