数据分析方法培训.pptx
《数据分析方法培训.pptx》由会员分享,可在线阅读,更多相关《数据分析方法培训.pptx(40页珍藏版)》请在课桌文档上搜索。
1、,数据分析方法培训,目录,数据分析前的思考,案例分享,深层次数据分析,数据分析前,我们需要思考,3,孙子兵法谋攻篇:故上兵伐谋,其次伐交,其次伐兵,其下攻城;攻城之法为不得已。,像一场战役的总指挥影响着整个战役的胜败一样,数据分析师的思想对于整体分析思路,甚至分析结果都有着关键性的作用。,问题,分析结果呈现,分析思路与方法,数据选取,数据分析前,我们怎么去思考?,每一个步骤可能面临的问题以及需要准备的东西?4,选取的分析,软件以及分,析方法(统,计学相关方,法)。,分析问题和解决问题的思路,5,定义问题,第一步,首先,要搞清问题的实质,准确、完整、真实地表达问题。,其次,弄清楚为什么要解决这个
2、问题?最后,解决这个问题的意义何在?是必须解决还是无关紧要,或是需要马上解决还是不太着急。,第二步,收集整理信息,搜集、整理关于要解决问题的历史资料、类似情况和现状。,第三步,选取分析方法,分析涉及到的主要维度,为后面提取数据需求作准备;,第四步,数据提取整理,根据分析内容以及分析方法,提出分析所需的数据需求;,对于反馈回来的数据,需要进行部分加工,以便更能反应所要分析的问题。,第五步,分析结果及结论,根据分析的结果,得出一些当前问题产生的一些结论。这,里注意分析的方法以及维度,结果的展示方式等。结论需要求足够的数据做支撑。,第六步,实施及建议措施,针对数据分析结论,给出当前问题的解决建议措施
3、。,一方面从业务层面进行建议措施,另一方面,可以就问题点进行更深层次分析,给出数据挖掘层面的解决措施。,第七步,实施效果评估及报告整理,根据措施实施效果进行实际评估,将完成的分析过程,结,果以及评估整理报告,为以后出现问题提供经验教训。对于本次没有完全解决的问题,进行说明。,例如,从现有的报表数据中就能够看到当前问题点的数据情况或者一段时间的趋势;两个重点步骤,精确的陈述问题,Where-哪里存在问题?What-存在的问题是什么?,Why-原因在哪里?When-什么时候开始出现这样的问题?Who-与什么对象有关?How many-发生的次数和数量?How much-损失有多大?,爱因斯坦说:“
4、精确的陈述问题比解決问题还来得重要”5W2H法:5W:What,When,Where,Who,Why;2H:How及How many;,使用这个方法,阿根廷队世界杯输球了,如果你,是马拉多纳,你怎么去思考?,定义问题,收集整理信息,选取分析方法,数据提取整理,分析结果及结论,实施及建议措施,实施效果评估及报告整理,问题展现方式,问题现状直接原因,最终原因,问题的结构如同这座冰山初步的问题分析,深层次的问题分析,问题结构是由现状、直接原因以及最终原因构成的。针对直接原因进行的叫初步问题分析,针对最终原因进行分析的叫深层次问题分析。7,治标,治本,定义问题,收集整理信息,选取分析方法,数据提取整理
5、,分析结果及结论,实施及建议措施,实施效果评估及报告整理,问题分解,8,问题陈述,问题/假设1,问题/假设2,问题/假设3,分支问题分支问题,分支问题分支问题分支问题,分支问题,为什么使用逻辑树?,1.将问题分成几个部分使解决问题的工作可以分成智力上能够解决的几个部分不同部分可按轻重缓急区分工作责任能分派到各人,2.保证问题获得完整地解决将问题的各个部分解决好,即可解决整个问题所分问题的各个部分各不相同,而且包括了各个方面(即没有重叠没有遗漏)3.使项目小组共同了解解决问题的框架,4.协助重点使用组织框架及理论,定义问题,收集整理信息,选取分析方法,数据提取整理,分析结果及结论,实施及建议措施
6、,实施效果评估及报告整理,分析方法,统计方法的三大特性,用三句话来简单概括一下:,反应客观现象的数据,描述性统计(包括统计数据的收集、整理、显示和分析),实用性:除了实情,数据能证明一切;丰富性:统计就像比基尼,露出来的部分固然诱人,没露出来的部分才是最要命的;公平性:我们相信上帝,其它人请用数据说话。概率论(包括分布理论、大数定律和中心极限定理),推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等),总体内在的数量规律性9,样本数据总体数据,定义问题,收集整理信息,选取分析方法,数据提取整理,分析结果及结论,实施及建议措施,实施效果评估及报告整理,描述性统计分析,“五点法”:最小
7、值,1/4分位数,均值,3/4分位数,最大值“两度”:峰度,偏度六西格玛:检验统计量的取值空间6 10,定义问题,收集整理信息,选取分析方法,数据提取整理,分析结果及结论,实施及建议措施,实施效果评估及报告整理,2,1,2,0,y,-1,y,-2,-2,-1,0,1,-1,-2,0,2,2,1,y,0,y,4,6,8,负相关,相关但非线性相关,推断统计分析,11,回归分析是统计分析思想中最基础、最集中的一个领域。,高斯、高尔顿相关分析&回归分析,-3,-2,1,2,(a),-2,1,2,(b),x,-2,-1,0,1,2,x,-3,-2,-1,0,1,2,3,x,-1 0不相 x 关(c),-
8、1 0正相关(d),变量的选取;预测推断;P值:回归分析就是放“P”,放得好,就合格。,定义问题,收集整理信息,选取分析方法,数据提取整理,分析结果及结论,实施及建议措施,实施效果评估及报告整理,变量分析方法选取,对象,变量的关系,类型,因变量自变量,预测和解释变量的个数,变量的,相,互关系,变量的,结,构关系,多因变量与自变量多因变量与自变量单一变量存在多,存在多重关系存在单一关系重关系,变量,样本,因变量测量尺度,结构方程式模式数量型非数量型,数量型非数量型,自变量尺度测量,典型相关分析多元方差分析,因变量尺度测量多元回归分析结合分析,数量型非数量型多元判别分析Logistic回归离散选择
9、模型CHAID,因子分析/主成分析,聚类分析,变量,测,量,尺度,数量型,非,数量型,多维尺度分析,对应分析,一张简单的图胜过千言万语!12,定义问题,收集整理信息,选取分析方法,数据提取整理,分析结果及结论,实施及建议措施,实施效果评估及报告整理,数据挖掘分析,13,按挖掘方法分类:包括统计方法,机器学习方法,神经网络方法和数据库方法,其中:,统计方法可分为:判别分析(贝叶斯判别、费歇尔判别、非参数判别等),聚类分析(系统聚类、动态聚类等),探索性分析(主成分分析等)等。机器学习方法可分为:归纳学习方法(决策树、规则归纳等),基于范例学习,遗传算法等。神经网络方法可以分为:前向神经网络(BP
10、算法等),自组织神经网络(自组织特征映射、竞争学习等)。数据库方法分为:多为数据分析和OLAP技术,此外还有面向属性的归纳方法。,关联规则关联规则反映一个事物与其它事物之间的相互依存性和关联性,如果两个事物或者多个事物之间存在一定的关联关系,那么其中一个事物就能够通过其他事物预测到。,Ps:,多元统计分析中的聚类分析有个阈值,用于确定分类的一个临界值,平时会遇到把它读成f,误以为它是“阀”字。正确的应该是阈(念y)值,而不是阀值.,定义问题,收集整理信息,选取分析方法,数据提取整理,分析结果及结论,实施及建议措施,实施效果评估及报告整理,网管中心数据 CRM数据,一经数据 第三方调查数据 14
11、,海量的数据,eg,数据提取时注意的几点问题。经分数据 BOSS数据,定义问题,收集整理信息,选取分析方法,数据提取整理,分析结果及结论,实施及建议措施,实施效果评估及报告整理,选取分析所需的相关数据,制定数据提取需求,15,人口统计 性别 年龄 户藉 职业 婚姻状况 教育程度 收入,客户,办理时间地点 办理的渠道 办理的业务种类 生效和失效时间,购买行为 消费行为 沟通记录 销售概率,帐单信息,分群特征 离网概率 离网原因,客户价值高利润率中等利润率低利润率负利润率 服务与产品 使用的产品 使用的服务功能 接受的营销offer 享受的客户服务,态度形象价值观生活方式心理因素 客户偏好 渠道偏
12、好 联络时间偏好 服务内容偏好,帐户信息,高级资料 性格和爱好 反感的业务 家庭情况 缴费方式,使用清单 缴费记录行为信息,基本资料地址、电话、email、籍贯等语言、行业手机相关信息网络状况,业务办理信息,行为方式通话时段繁忙和非繁忙通话量漫游服务方便程度行为方式的变化 客户交互信息 客户交互概况 整合的投诉历史 整合的咨询历史 主动联络客户历史客户分析信息,注意数据提取粒度,定义问题,收集整理信息,选取分析方法,数据提取整理,分析结果及结论,实施及建议措施,实施效果评估及报告整理,数据质量的评估,在现实社会中,存在着大量的“脏”数据 不完整性(数据结构的设计人员、数据采集设备和数据录入人员
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 方法 培训
链接地址:https://www.desk33.com/p-354044.html