《旅游舆情监测项目解决方案说明书.docx》由会员分享,可在线阅读,更多相关《旅游舆情监测项目解决方案说明书.docx(10页珍藏版)》请在课桌文档上搜索。
1、旅游舆情监测项目解决方案说明书XX科技股份有限公司编制目录一、项目存在问题及需解决问题41 .存在问题42 .需解决问题4二、解决方案61 .解决方案架构62 .关键技术7(1) Hadoop7(2) SpringMVC7(3) MyBatis8(4) Echarts8(5) MySQ1.8(6) I1.ive8(7) HBASE9(8) Zookeeper9(9) F1.ume9三、开发范围101. 数据生产102. 数据采集/消费103. 数据分析114. 数据展示12一、项目存在问题及需解决问题1 .存在问题近年来,围绕旅游行业的各种热点事件和负面舆情呈现逐年上升态势。典型事件如“青岛大
2、虾事件”、”哈尔滨天价鱼事件”、“云南游客被打事件”、“颐和酒店女生遇袭事件”等。这些对相关旅游目的地和旅游企业都产生了很大程度的负面影响,而这种趋势会长期持续。因此,提前做好危机管理颈案,提升危机公关能力就成为旅游管理部门相关企业的重要职责。2 .需解决问题随着现代信息技术和网络媒体发展,游客可通过手机微博、微信等传播方式,将旅游中的遭遇与不满公之于众,绐旅游产业带来很大损害。各级政府和旅游管理部门应提升舆情危机管理、应对和处理能力,以修补在网络舆情危机中受损的旅游企业和旅游目的地形象,进一步提升旅游产业竞争力。因此需做到以下几点:1,及时发现旅游相关重要舆情系统7*24实时采集分析全网关注
3、的旅游公司相关数据、监测境内外社交媒体平台,实时动态显示数据,秒级更新数据,便于早发现舆情。2、准确预警旅游舆情,早发现相关苗头系统支持设定告警关键词的方式,对用户定义的公司监控主题信息进行告警,方便及时掌握重点舆情信息,发现旅游舆情后通过微信、短信、邮件等方式实现离线告警,避免遗漏重要信息。3、实时跟踪旅游舆情事件发展实时推送旅游舆情信息,及时跟踪负面舆情信息的来源、转载量、转载地址、地域分布、信息发布者等,对舆情事件进行倾向性与趁势分析,能够很好的把握旅游舆情事件传播的路径,掌控舆情发展的态势。4,深入分析笳游舆情事件能找出关注博文的传播源头,讨论数量及话题出现的最早和最近时间,并能直观展
4、示不同平台相关话题的讨论比例,可对选中文字查看其传播源头,能识别微博言论潜在的意见领袖,实时获取其最新数据,对重点关注博主的社交关系、关联身份、博主圈、所属地域、博主类型进行系统分析,可对博文情感、传播路径、影响力和活跃度、区域热点等进行整体分析。5、快速引导椒游舆论发展方向可以帮助相关部门在各大网络媒体,包括微博等新媒体平台快速传播信息,弘扬主旋律,传播正能量,引领社会正气,将舆论监督和正面宣传相结合。短时间内在各大平台以官方声明的方式发布正确观点,引导舆论走向,向人民群众澄清谬误,防止虚假消息进一步扩散。6、深度总结旅游舆情事件提供常规性报告、专题性报告、综合性报告服务,整合与之相关的旅游
5、舆情带来更深层次的理性思考,致力于旅游舆情事件的追踪、分析与应对,为公司相关部门提供专业的舆情应对建议以及数据分析服务。二、解决方案1 .解决方案架构1IB三af1.tMa图1解决力案架为图系统开发平台使用Hadoop大数据开发平台。Hadoop是一个高度可扩展的存储平台,可以存储和分发横跨数百个并行操作的廉价的服务器数据集群。能扩展到处理大量的数据,能提供成百上千TB的数据节点上运行的应用程序。Hadoop能够有效的在几分钟内处理TB级的数据。相比关系型数据库管理系统更具有优势。它适用于任何规模的非结构化数据持续增长的企业,将帮助用户持续提高用户体验。系统采用面向对象的软件设计方法,把整个系
6、统看作是多个离散对象的组合。系统设计时,首先把业务流程分解成功能模块及其业务实体对象,然后根据业务流程分析对于这些业务实体对象的操作方法,形成业务处理对象,最后把各个功能模块关联起来,形成系统。软件设计是一个将需求转变为软件的过程,系统通过逐步求精使得设计陈述逐渐接近于源代码。系统程序采用VVC的设计思想,将展现逻辑.控制逻辑、业务处理逻辑分离。系统采用参数化的设计思想,定义和管理系统的实体及配置,调整实体以适应外部变化。系统采用J2EE技术保证程序逻辑实现的平台无关性,并便于安装部署。系统采用AJAX技术,提高客户操作的交互性,保证实际使用的易用性。系统采用echarts可视化框架实现数据展
7、示。2 .关键技术(1) HadoopHadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。(2) SpringMVCSpringMVC:属于Spring1.rameWork的后续产品,已经融合在SpringWebFIOW里面。Spring框架提供了构建Web应用程序的全功能MVC模块。(3) MyBatisMYBatis:是支持普通SQ1.查询,存储过程和高级映射的优秀持久层框架。MyBatis消除了几乎所有的JDBC代码和参数的手工设置以及结果集的检索。MyBatis使用简单的XM1.
8、或注解用于配置和原始映射,将接口和Java的POJOS(P1.ainO1.dJavaObjects,普通的JaVa对象)映射成数据库中的记录。(4) EchartsEChar1.s是一款基于Javascrip1.的数据可视化图表库,提供直观,生动,可交互,可个性化定制的数据可视化图表。(5) MySQ1.MySQ1.是一个关系型数据库管理系统,由瑞典MySQ1.AB公司开发,属于OraCIe旗下产品。MySQ1.是最流行的关系型数据库管理系统之一,在WEB应用方面,MySQ1.是最好的RDBMS(Re1.ationa1.Da1.abaSeManagemCnISyStem,关系数据库管理系统)应
9、用软件之一MySQ1.是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。MySQ1.所使用的SQ1.语言是用于访问数据库的最常用标准化语言。MySQ1.软件采用了双授权政策,分为社区版和商业版,由于其体积小、速度快、思体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择MySQ1.作为网站数据库。(6) Hivehive是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQ1.查询方式来分析存储在Hadoop分布式文件系统中的数据:可以将结构化的数据文件映射为一张数据库表,并提供完整的SQ1.查
10、询功能;可以将SQ1.语句转换为MapReduce任务运行,通过自己的SQ1.查询分析需要的内容,这套SQ1.简称HiveSQ1.,使不熟悉mapreduce的用户可以很方便地利用SQ1.语言查询、汇总和分析数据。而mapreduce开发人员可以把自己写的mapper和reducer作为插件来支持hive做更复杂的数据分析。它与关系型数据库的SQ1.略有不同,但支持了绝大多数的语句如DD1.、DM1.以及常见的聚合函数、连接查询、条件查询。它还提供了一系列的:具进行数据提取转化加载,用来存储、查询和分析存储在HadooP中的大规模数据集,并支持UDF(User-DefinedFUnCtiOn)
11、、UDAF(USer-DefneSAggregateFunction)和UDTF(User-DefinedTab1.e-GeneratingFunction),也可以实现对map和reduce函数的定制,为数据操作提供了良好的伸缩性和可扩展性。(7) HBASEHBase-HadoopDatabase,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBaSe技术可在廉价PCSerVer上搭建起大规模结构化存储集群。(8) ZookeeperZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是GOOgIe的ChUbby一个开源的实现,是HadooP和HbaSe的重
12、要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。(9) F1.umeFIUme是CIoUdera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,F1.ume支持在日志系统中定制各类数据发送方,用于收集数据;同时,FIUme提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。三、开发范围1 .数据生产对于该模块的业务,即数据生产过程,一般并不会让你来进行操作,数据生产是一套完整且严密的体系,这样可以保证数据的安全性。但是如果涉及到项目的一体化方案的设计(数据的产生、存储、分析、展示),则必须清楚每一个环节
13、是如何处理的,包括其中每个环境可能障藏的问题;数据结构,数据内容可能出现的问题。2 .数据采集/消费数据采集模块(消费),在企业中你要清楚流式数据采集框架f1.ume和kafka的定位是什么。我们在此需要将实时数据通过f1.ume采集到kafka然后供给给hbase消费。f1.ume:C1.OUdera公司研发适合下游数据消费者不多的情况;适合数据安全性要求不高的操作;适合与Hadoop生态圈对接的操作。kafka:Iinkedin公司研发适合数据下游消费众多的情况;适合数据安全性要求较高的操作(支持rep1.ication);因此我们常用的一种模型是:线上数据一f1.umekafkaf1.ume(根据情景增删该流程)HD1.-S线上数据一f1.umekafkasparkstreaming实时流式处理消费存储模块流程图:图2消费存储模块流程图3 .数据分析我们的数据巳经完整的采集到了HBaSe集群中,这次我们需要对采集到的数据进行分析,统计出我们想要的结果。注意,在分析的过程中,我们不一定会采取一个业务指标对应一个mapreduce-job的方式,如果情景允许,我们会采取一个mapreduce分析多个业务指标的方式来进行任务。分析模块流程图:图3分析模块流程图4 .数据展示数据展示模块流程图:gtp*图1数据展示模块流程图
链接地址:https://www.desk33.com/p-1783497.html