第五讲机器学习1.docx
《第五讲机器学习1.docx》由会员分享,可在线阅读,更多相关《第五讲机器学习1.docx(7页珍藏版)》请在课桌文档上搜索。
1、第五讲机器学习教学内容:本章主要学习机器学习概念与类型、机器学习经典算法、深度学习概念与应用。教学重点:监督学习、分类、深度学习及其应用。教学难点:深度学习目标检测应用。教学方法:课堂教学为主,结合智慧树等在线平台实时提问、收集学生学习情况,充分利用网络课程中的多媒体素材来表示机器学习原理和过程。讨论五分钟。课后布置作业,要求学生查找、阅读与经典机器学习、深度学习有关的经典论文等。学习慕课第五章机器学习并完成章节测试。教学要求:重点掌握K近邻分类算法、K均值聚类、深度学习目标检测算法,了解强化学习、迁移学习基本概念。课程思政内容:深度学习算法方向涌现出李飞飞、吴恩达、何凯明等众多华人著名学者。
2、周志华等世界著名机器学习专家。激励学生向科学家们学习他们不断探索、突破,提出新理论、新算法和新思想。学习目标:1 .掌握和理解机器学习基本原理;2 .掌握和理解监督学习原理及几种主要的分类方法。3 .理解和掌握深度学习基本原理。学习导言人类智能的重要而显著的能力是学习能力。无论幼小的孩子还是成人,都具备学习能力。人类的学习能力也是随着年龄增长不断增强的。如果机器也能像人一样通过学习去掌握知识,这种机器产生类人智能的可能性显然更大。机器能像人一样具备学习能力吗,如果能的话,那么机器如何做到呢?机器具备了学习能力,是否就具有了智能或类人的智能,甚至产生完全不同于人类的智能?这两个问题都取决于机器如
3、何能够具有学习能力。本章要学习的内容主要是从机器如何具有学习能力的角度来学习一些基本原理和方法,从经典的分类算法到目前流行的深度学习方法,我们可以大概了解机器学习的优势与劣势,为开发更先进的机器学习技术奠定基础。5.1 机器学习能够实现机器智能吗人类在成长、生活过程中积累了很多的历史与经验。人类定期地对这些经验进行“归纳”,获得了生活的“规律”。当人类遇到未知的问题或者需要对未来进行“预测”的时候,人类使用这些“规律”,对未知问题与未来进行“预测”,从而指导自己的生活和工作。机器学习中的“训练”与“预测”过程可以对应到人类的“归纳”和“预测”过程。通过这样的对应,可以发现机器学习仅仅是对人类在
4、生活中学习成长的一个模拟。由于机器学习不是基于编程形成的结果,因此它的处理过程不是因果的逻辑,而是通过归纳思想得出的相关性结论。要通过现阶段的机器学习技术使机器具备类人智能,还有很大差距,但己经发展出的机器学习技术(通过计算机进行各种数据分析和处理的能力)又是人类智能所无法比拟的。现实中,有一些机器学习方法与人类智能没有关系,比如统计学习。统计学习是基于数学统计学发展而来的一种机器学习方法,因为学习算法中涉及了大量的统计学理论,也被称为统计学习理论。其目的在于采用经典统计学大量久经考验的技术和操作方法,比如贝叶斯网络,利用先前知识概念等实现机器智能。5.2 机器学习的类型和应用1 .按方法划分
5、从方法的角度划分,机器学习模型可以分为线性模型和非线性模型。线性模型较为简单,但作用不可忽视,线性模型是非线性模型的基础,很多非线性模型都是在线性模型的基础上变换而来的;非线性模型又可以分为深度学习模型和传统机器学习模型(如支持向量机(SupportVectorMachine,SVM),K最近邻(K-NearestNeighbor,KNN)、决策树等)。2 .按学习理论划分按照不同的学习理论划分,机器学习模型可以分为有监督学习、半监督学习、无监督学习、迁移学习和强化学习。3 .按任务划分按任务划分类型,机器学习模型可以分为回归模型、分类模型和结构化学习模型。回归模型又叫预测模型,输出是一个不能
6、枚举的数值;分类模型又分为二分类模型和多分类模型,常见的二分类问题有垃圾邮件过滤,常见的多分类问题有文档自动归类;结构化学习模型的输出不再是一个固定长度的值,如图片语义分析,输出是图片的文字描述。4 .按照求解的算法划分可以将分类算法分为判别模型和生成模型。给定特定的向量X与标签值户生成模型对联合概率P(x,y)建模,判别模型对条件概率P(),次)进行建模。常见的生成模型有:贝叶斯分类器、高斯混合模型、隐马尔可夫模型、受限玻尔兹曼机、生成对抗网络等;典型的判别模型有:决策树、k最近邻算法、人工神经网络、支持向量机、IogiStiC回归和AdaBOoSt算法等。5.3 监督学习与无监督学习在实际
7、应用中,机器学习主要以监督学习方式为主,其他还有少数无监督学习、半监督学习以及小样本、弱标注等技术。无监督学习与监督学习相比,最大区别就是数据训练集没有人为标注,常见的无监督学习算法称为聚类。半监督学习介于监督学习与无监督学习之,是结合(少量的)标注训练数据和(大量的)未标注数据来进行学习。第4章中我们介绍的单层感知器、CNN和RNN的网络模型训练都是监督学习,而DBN是基于概率的“生成模型”,预训练过程是无监督学习,依靠无监督地“逐层初始化”,训练每一层的RBM。监督学习的实现主要依靠各种分类方法,所有机器要处理的数据都要由人为定义好相应的类别,再对分类算法进行训练,最后得到可以使用的分类器
8、,由于分类方法不同,各种分类器性能也有差异0k-最近邻分类最简单的多分类技术是Z最近邻(KneareSIneighbor,KNN)分类。顾名思义,输入被简单指定为其最近邻的类别。如图5.4,对于给定的训练数据,通过搜索整个数据集中个最相似的实例(邻居),汇总这4个实例的输出变量可以预测新的数据点。对于回归问题,它可能是输出变量的平均值;对于分类问题,它可能是模式类别值。使用2-最近邻算法的关键在于如何确定数据实例之间的相似性。K均值聚类算法到目前为止,所讨论的分类器都是监督学习,在很多实际应用中,也采用无监督学习。无监督学习从给定的数据中寻找隐藏的结构,即从无标记的训练数据中推断结论。最典型的
9、无监督学习就是聚类分析,它可以在探索性数据分析阶段用于发现隐藏的模式或者对数据进行分组。在聚类这种模型中,算法会根据数据的一个或多个特征将一组特征向量组织成聚类。如图5.8,是种简单的左一均值聚类算法(匕meansclusteringalgorithm),把个对象根据他们的特征分为左个分割,&。其中,攵表示为样本分配的聚类的数量。可以使用一个随机特征向量来对个聚类进行初始化,然后将其它样本添加到其最近邻的聚类(假定每个样本都能表示一个特征向量,并且可以使用常规的欧氏距离公式来确定距离)。随着一个聚类添加的样本越来越多,其形心即聚类的中心就会重新计算,然后该算法会重新检查一次样本,以确保它们都在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 机器 学习
链接地址:https://www.desk33.com/p-1192841.html