《数据采集与预处理》教学大纲.docx
《《数据采集与预处理》教学大纲.docx》由会员分享,可在线阅读,更多相关《《数据采集与预处理》教学大纲.docx(6页珍藏版)》请在课桌文档上搜索。
1、数据采集与预处理教学大纲适用意围:2O2X版本科人才培养方案涕程代码:08140501课程性质:专业必修课学分:4学分学时:N学时(理论48学时,实验16学时)先修课程:Py1.hOn程序设计、Web谛端开发技术后续课程:数据挖掘技术、数据可视化适用专业:数据科学与大数据技术、数据科学与大数据技术专升本开课单位:计算机科学与技术学院一、课程说明小数据采集与预处理是数据科学与大数据技术专业必修的一门专业必修课,本课程主要传授数据果集技术的相关方法,岩重讲解通过大数据采集、数据解析以及数匏按处理的相关方法和应用,为学习数据挖撼技术等有关课程及以后从事技术工作打下必要的基础.本深程注重方法的应用学习
2、,强调培养解决同时的能力兼顾新技术及其发展方向的介绍,培养“有足峪理论基础、动手能力强”的高索质应用型人才.二、课程目标通过本课程的学习,使学生达到如下目标:课程目标I:了斛数据采集的相关方法,了解Web相关技术,掌握网络爬虫的相关方法,务使用网络爬虫技术获取相关数据并进行数据解析:掌握数据预处理的相关方法.课程目标2:综合运用数据采集的方法和数据假处理的方法,完成相关数据的采集的综合工程项目.为之后的数据挖掘等后续工作也准符.在课程教学中把理想信念教育与科学精神的培养结合起来,提高学生用马克思主义的世界观和方法论认识、分析和解决问题的能力。课程目标3:理解网络型虫、数据安全有关的国家标准、行
3、业标准、企业标准、法律法现以及相关知识产权、行业政策.三、课程目标与毕业要求与数据采集与预处理课程教学目标对数据科学与大数据专业毕业要求的支挣见表k表1课程被学目标与毕业聂求关系毕业要求指标点课程目标支撑93.设计/开发解决方案3.1理解数据科学与大数据技术领域工程项目设计方法与开发技术及其时社会、健课程目标2;综合运用数据采柒的方法和数据预处理的方法,完成相关数据的采集的媒合工程项Ih为之后的数据挖物等后续工H康、安全、法律、文化以及环境方面的影响。作做准备。在课程教学中把理想信念教育与科学精神的培养结合起来,提高学生用马克思主义的世界观和方法论认识、分析和解决问题的能力.5.使用现代工具5
4、.1了解信息领域主要资料来源及获取方法,熟悉数学、程序设计等数据科学与大数据技术领域现代工程工具。课程目标h/解数据采集的相关方法,了解WCb相关技术,掌握网络爬虫的相关方法,并使用网络爬虫技术获取相关数据并迸行数据解析;掌叔数据预处理的相关方法.H8.职业加粮8.2具有社会责任感.理解数据科学与大数据技术领域的相关职业道馅和规范,并且在工程实践中自觉遵守,履行职费.课程目标3:理就网络爬虫、数据安全有关的国家标准、行业标准,企业标准、法律法规以及相关知识产权、行业政策.M注:表中-H(MXM(中)”表示课程与相关毕业要求的关联度.四、教学内容,基本要求与学时分配1.理论部分理论部分的教学内容
5、、基本要求与学时分配见表2。表2教学内容、苓本要求与学时分配教学内容教学要求,彼学篁点难点理论学时实验学时对应的课程目标1.数据采集技术的茶本方法1.1爬虫的基础知识1.2 爬虫库的基本使用1.3 数据的存储做学要求t熟悉贬虫小础知识:堂蝗爬虫库的基本使用;理解网JAroboi协议的规则:掌握数据数据存储技术.重点I掌握爬虫库的基本使用:掌理数据数据存储技术.魔点:掌握通虫底的星本使用;掌握数据数据存储技术。1241.2.32数据解析2. 1峥态页面的数据解析2.1 动态页面数据好析教学要求;掌握静态页面BS熔、IXm1.军和正则表达式的使用方法;掌握Se1.eniUm的用法:掌握动态页面JS
6、ON数据的处理.点,掌樨静态页面BS犀.Ixm1.库和正则发达式的使用方法:掌维动态页面JSON数据的处理。充点:掌握静态页面BS库、IXm1.库和正则表达式的使用方法:掌握动态页面JSON数据的处理.124K2&爬虫柢架技术3.1爬虫框架技术介绍3.2抓取框架应用收学要求熟悉鹿虫框架的原珅,掌押爬虫框架技术的应用.重点:熟悉爬虫框架的原理:拿理於虫框架技术的应用.难点I熟悉曜虫框架的原理:掌握爬虫框架技术的应用。12I1、2、3敷据5(处理4.1文本分析4.2使用Python的库进行数据清洗、数据转换等预处理悚作教学要求:掌握使用PythOn的第:一方及进行数据文本分析、数据清洗、数据利化等
7、的预处理操作。值点,文本分析,使用Python的库进行数据清洗、数据转换等预处埋操作.难点;文本分析,使用Python的库进行数据清洗、数据转换等预处理操作,1241、2.3合计18162.实验部分实验部分的教学内容、基本要求与学时分配见表3。表3实殴项目、实殴内容与学时实验弼实验内容和旻求实验学时对应的课程目标1.网页数据的采集与存储实3内部使用爬虫库荻取网站数据.存储获取数据.实验要求:掌握爬虫诉的相关方法获取M站数据;对数据进行存储。41、32.数据解析应用实3内容t使用解析库(Bcautifu1.Soup.XPa1.h、正则表达式等)对荻取网站数据进疗解析:动态网页中JSON数据处理.
8、实殴要求:学提数据解析像的相关方法进行数据解析,将解析后的数据进行存储.41、23.爬虫框架应用实5金内容:使用Scrapy框架完成网站数据爬取、解析和存储.实援要求:熟悉Scrapy框架的工作原理、安装和应用.41、2、31.数据预处理技术应用实3内部利用PNhon的相关技术进行数据的文本分析,并进行数据预处理.实Ift要求,熟悉数据预处理的相关阵,并先成相关的预处理操作.41.2.316五、教学方法及手段本课程以课堂讲授为主,课下在线学习为辅教学方式.课上讲授采用启发式、讨论式教学、案例教学、随堂测验等,开发学生的潜能,培养学牛.思考问题、分析问题和斛决问题的能力;以“少而精”为原则,精选
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据采集与预处理 数据 采集 预处理 教学大纲
链接地址:https://www.desk33.com/p-1794860.html