excel数据分析.pptx
《excel数据分析.pptx》由会员分享,可在线阅读,更多相关《excel数据分析.pptx(31页珍藏版)》请在课桌文档上搜索。
1、Excel 数据分析,世界上的数据分析师分为两类,使用Excel的分析师,和其他分析师。每一个数据新人的入门工具都离不开Excel。因为Excel涵盖的功能足够多。很多传统行业的数据分析师只要求掌握Excel即可,会SPSS/SAS是加分项。即使在挖掘满街走,Python不如狗的互联网数据分析界,Excel也是不可替代的。,1.Excel常用函数,清洗处理类,主要是文本、格式以及脏数据的清洗和转换。很多数据并不是直接拿来就能用的,需要经过数据分析人员的清理。数据越多,这个步骤花费的时间越长。,关联匹配类,在进行多表关联或者行列比对时用到的函数,越复杂的表用得越多。良好的表习惯可以减少这类函数的
2、使用。,逻辑运算类,数据分析中不得不用到逻辑运算,逻辑运算返回的均是布尔类型,True和False。很多复杂的数据分析会牵扯到较多的逻辑运算,关联匹配类,常用的基础计算、分析、统计函数,以描述性统计为准。,时间序列类,专门用于处理时间格式以及转换,时间序列在金融、财务等数据分析中占有较大比重。时机序列的处理函数比我列举了还要复杂,比如时区、分片、复杂计算等。这里只做一个简单概述,2.Excel数据处理技巧,快捷键,Excel的快捷键很多,以下主要是能提高效率,格式转换,Excel的格式及转换很容易忽略,但格式会如影随形伴随数据分析者的一切场景通常我们将Excel格式分为数值、文本、时间时间格式
3、在Excel中可以和数值直接互换,也能用加减法进行天数换算。时间格式有不同表达。例如2016年11月11日,2016/11/11,2016-11-11等。当数据源多就会变得混乱。我们可以用自定义格式规范时间。这里了解一下时间格式的概念,列举是一些较通用的范例。YYYY代表通配的四位数年格式MM代表通配的两位数月格式DD代表通配的两位数日格式HH代表通配的的两位数小时(24小时)格式hh代表通配的两位数小(12小时制)格式mm代表通配的两位数分格式ss代表通配的两位数秒格式例如2016/11/11可以写成:yyyy/MM/dd2016-11-11 23:59:59可以写成:yyyy-MM-dd
4、HH:mm:ss,数组,数组很多人都不会用到,甚至不知道有这个功能。依旧是数据分析越往后用到越多,它类似R语言的Array和Python的List。数组由多个元素组成。普通函数的计算结果是一个值,数组类函数的计算结果返回多个值。数组用大括号表示,当函数中使用到数组,应该用Ctrl+Shift+Enter输入,不然会报错。先看数组的最基础使用。选择A1:D1区域,输入=1,2,3,4。记住是大括号。然后Ctrl+Shift+Enter。我们发现数组里的四个值被分别传到四个单元格中,这是数组的独有用法。,我们再来看一下数组和函数的应用。利用,我们能做到1匹配a,2匹配b,3匹配c。也就是一一对应。
5、专业说法是Mapping。=lookup(查找值,1,2,3,a,b,c)Excel的数组具体应用,大家可以搜索学习,可以提高一定的效率。,数组,数组很多人都不会用到,甚至不知道有这个功能。依旧是数据分析越往后用到越多,它类似R语言的Array和Python的List。数组由多个元素组成。普通函数的计算结果是一个值,数组类函数的计算结果返回多个值。数组用大括号表示,当函数中使用到数组,应该用Ctrl+Shift+Enter输入,不然会报错。先看数组的最基础使用。选择A1:D1区域,输入=1,2,3,4。记住是大括号。然后Ctrl+Shift+Enter。我们发现数组里的四个值被分别传到四个单元
6、格中,这是数组的独有用法。,我们再来看一下数组和函数的应用。利用,我们能做到1匹配a,2匹配b,3匹配c。也就是一一对应。专业说法是Mapping。=lookup(查找值,1,2,3,a,b,c)Excel的数组具体应用,大家可以搜索学习,可以提高一定的效率。,分列,Excel可以将多个单元格的内容合并,但是不擅长拆分。分列功能可以将某一列按照特定规则拆分。常常用来进行数据清洗。,有一列地区的数据,我想要将市和区分成两列。我们可以用mid和find函数查找市截取字符。但最快的做法就是用“市”分列。,条件格式,条件格式可以当作数据可视化的应用。如果我们要使用函数在大量数据中找出前三的值,可能会用
7、到rank()函数,排序,然后过滤出1,2,3。用条件格式则是另外一种快速方法,直接用颜色标出,非常直观。,自定义下拉菜单(数据有效性),数据有效性是一种约束,针对单元格限制其输入,也就是让其只能固定几个值。下拉菜单是一种高阶应用,通过允许下拉箭头即可。,自定义名称,自定义名称是一个很好用的技巧,我们可以为一个区域,变量、或者数组定义一个名称。后续要经常使用的话,直接引用即可,无需再次定位。这是复用的概念。,我们将A1:A3区域命名为NUM直接使用=sum(NUM),等价于sum(A1:A3)。,自定义名称,自定义名称是一个很好用的技巧,我们可以为一个区域,变量、或者数组定义一个名称。后续要经
8、常使用的话,直接引用即可,无需再次定位。这是复用的概念。,我们将A1:A3区域命名为NUM直接使用=sum(NUM),等价于sum(A1:A3)。,查找公式错误,公式报错也不知道错在哪里的时候可以使用,尤其是各类IF嵌套或者多表关联,逻辑复杂时。查找公式错误是逐步运算的,方便定位。,分组和分级显示,分组和分级显示,常用在报表中,在报表行数多到一定程度时,通过分组达到快速切换和隐藏的目的。越是专业度的报表(咨询、财务等),越可以学习这块。在数据菜单下。,分析工具库,分析工具库是高阶分析的利器,包含很多统计计算,检验功能等工具。Excel是默认不安装的,要安装需要加载项,在工具菜单下(不同版本安装
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- excel 数据 分析
链接地址:https://www.desk33.com/p-354833.html