SAPHANA案例.docx
*利用大数据后,农夫山泉会发生管理变革吗?YES*中国能制作出类纸牌展的电视局吗?NO大数据可以给阿迪达斯若来利消吗?YES*网易数据工程师可以当“媒婆,?YES中国政府未来会开放数据吗?YES*正在到来的数据草改变政府、甫业和我们的生活H(JUSE言oC%RDS文一本刊记者周恒星赵奕伏昕咎慧昉李春弹编辑一杨始房煜王琦就在制作这期“大数据专题"时,编辑部发生热烈讨论:什么是大数据?编辑记者们旁征博引,试图将数据堆砌的商业案例剔除,真正的、实用性强的数裾挖掘故事留下。我们报道的是伪大数裾公司?我们是否成为驾取大数据一书的作者Bi1.1.FrankS所称的“大数据骗局”中的一股力量?同样的质疑发生在阿里巴巴身上。有消息称,3月23日,阿里巴巴以7000万美元收购了一家移动开发者数据统计平台。这引发了专家们热烈讨论,它收购的真是一家大数据公司吗?这些质疑并非没有道理。中国确实没有大数据的土壤“差不多先生”、"大概齐”的文化标签一直存在。很多时候,各级政府不太需要“大数据”.形成决策的关糖性数据只有一个数字比率(GDP)而已;其二,对于行业主管机构来说,它们拥有大量原始数据,但它们还在试探、揍索数据开放的尺度,比方说,是开放原始数据,还是开放经过各种加工的数据?是转让给拥有更高级计算和储存能力的大型数据公司,还是将数据开源,与各种各样的企业共享?其三,数据挖挹的工具价值并没有完全被认同。在这个领域,硬件和软件的开展并不十分成熟.即便如此,没有人否认数相革命的到来,尤其在互联网行业。阿里巴巴的马云将大数据作为战略方向,百度的李彦宏用“相计算”来谋划未来。即便是CBA(中国男子箧球职业联赛)也学起了NBA(美国男置职业联泰)五花八门的数据统计、分析与挖掘。在过去两年间,大量的资本投资一些新型数务工具公司,根据美国道琼斯风险资源(DOWJOneSYCntUreSOUrce)的数据,在过去的两年时间里,11.7亿美元流向了119家数据库软件公司。去年,SAP市值已经超过西门子.成为德国市值战高的上市公司,而这样的业绩局部得费于其数据库软件HAM的商业化,去年一年时间里HANA带给SAP3.92亿欧元的收入,增长了1,12心但是,大数据还没法分析、挖掘出自己的直接变现能力。在截稿日时,我们再重新读维克托迈尔-舍恩伯格(ViktOrMayer-SCh纹berger)的大数据时代:生活、工作与思维的大变革一书,作者相信,未来,数隽会成为有价值的资产。假以时日,它会大摇大摆地进入资产负债表里。案例1:农夫山泉用大数据卖矿泉水案例2:阿迪达斯的.黄金罗盘”案例3:航空公司数据权之争案例备纸牌屋你学不会案例为网易"花出"为你定制爱情案例1:农夫山泉用大数据实矿泉水文一本刊记者赵奕编辑一房煜发挥你您的想象力,选择您认为可是的答案OOOm«»IiiiiiiiIiRNiiiiiiiMiiiiiiiitiiiiiiiiiiiiiiiii利用大数累后.农夫山泉会发生管理变革吗?YESQ祟:A.可以做到实时计H结果,不可能的事情变为可能B.决91者的依敏东来雎谑以往的决策是否正确C.对已出现的何H做出纠正,弃愤雳未来MitiiiiiiiiNeeiiiNiNiiiiiiimeaBiinatitiUINeitaiii*这里是上海城乡结合部九亭镇新华都超市的一个角落,农夫山泉的矿泉水堆头静整地摆放在这里。来自农夫山泉的业务员每天例行公事地来到这个点,拍摄10张照片:水怎么摆放、位置有什么变化、高度如何这样的点每个业务员一天要跑15个,按照规定,下班之前150张理片就被传回了杭州总部。每个业务员,每天会产生的数据量在10M,这似乎并不是个大数字。但农夫山泉全国有100OO个业务员,这样每天的数据就是100G,每月为3TB。当这些图片如雪片般进入农夫山里在杭州的机房时,这家公司的CIO胡健就会有这么一柠感觉:守着一座金山,却不知道从哪里挖下第一锹。.I1.1.1.iaiiaei1.1.1.1.1.1.1.1.1.1.1.t1.1.1.1.1.1.Mi1.i1.1.1.1.1.1.M1.1.1.i1.1.i1.1.ItI1.KItII2012年饮用水市场晶牌市场份颤胡能想知道的问题包括:怎样摆放水堆更能促进销售?什么年龄的消费者在水堆前停匿更久,他们一次购置的量多大?气温的变化让购置行为发生了哪些改变?竞争对手的新包装对销售产生了怎样的影响?不少问题目前也可以答复,但它们更多是基于经验,而不是基于数据。从2008年开始,业务员拍摄的照片就这么被收集起来,如果按照数据的属性来分类,“图片”属于典型的非关系型数据,还包括视频、音频等。要系统地对非关系型数据进行分析是胡健设想的下一步方案,这是农夫山泉在“大数据时代"必须迈出的步艰。如果超市、金融公司与农夫山泉有某种柔道来分享信息,如果类似图像、视频和音频资料可以系统分析,如果人的位置有更多的方式可以祓监测到,那么捶开在胡健面前的就是一幅基于人消费行为的画卷,而描绘画卷的是一组组发来的“0、1、1、Ow。SAP全球执行副总裁、中国研究院院长孙小群接受中国企业家采访时表示,企业对于数据的挖掘使用分三个阶段,“一开始是把数据变得透明,让大宗看到数裾,能够看到数据越来越多:第二步是可以提问题,可以形成互动,很多支持的工具来帮我们做出实时分析:而3.0时代,信息流来指导物流和资金流,¾在数据要告诉我们未来,告诉我们往什么坨方走。-SAP从2003年开始与农夫山泉在企业管理软件ERP方面进行合作。彼时,农夫山泉仅仅是一个软件采购和使用者,而SAP还是效劳商的角色。而等到2011年6月,SAP和农夫山泉开始共同开发基于“饮用水”这个产业形态中,运输环境的数据场景.关于运输的数据场景到底有多重要呢?将自己定位成“大自然投运工”的农夫山泉,在全国有十多个水源地。农夫山泉把水递装、叔送、上架,一瓶超市售价2元的55OmI饮用水,其中3毛钱花在了运输上。在农夫山泉内部,有着“搬上投下,银子哗哗”的说法。如何根据不同的变量因素来控制自己的物流本钱,成为问逝的核心。基千上述场景,SAP团队和农夫山泉团队开始了扬景开发,他们将偎多数据纳入了进来:高速公路的收到、道路等级、天气、配送中心辐射半径、季节性变化.不同市场的售价、不同渠道的附用、各地的人力本钱、甚至突发性的密求(比方某城市召开一次大型运动会)。在没有数据实时支排时,农夫山泉在物流领域花了很多冤枉钱。比方某个小品相的产品(350In1.饮用水),在某个城市的销量预测不到位叶,公司以往通售'的做法是通过大区间的调运,来弥补终端货源的缺乏。“华北往华南运,运到半道的时候,发现华东实际有充裕,从华东调运更廉价。但很快发现对华南的懂测有偏差,华北短缺更为严重,华东开始往华北运。此时如果大湖突发一次污染事件,很可能华东又出现短缺。"这种没头苍蝇的状况让农夫山里头疼不已。在采购、仓储、配送这条线上,农夫山泉特别希望大数据获取解决三个顽症:首先是解决生产和销售的不平街,准确获知该产多少,送多少;其次.让MO家办事处、30个配送中心能够纳入到体系中来,形成一个动态网状结构,而非简单的树状结构;最后,让退黄、残次等问题与生产基地能够实时连接是来。也就是说,销售的戢前端成为一个个神经末梢,它的任何一个痛点,在大脑这里梆能快速感知到。“日常运营中,我们会产生销售、市场费用.物流.生产、财务等数据,这丝数据都是通过工具定时抽取到SAPBW或OraC1.eDM,再通过BUSineSSObjeCt展现."胡健表示,这个“展现”的迨程长达24小时,也就是说,在24小时后,物流、资金流和信息流才能会聚到一起,彼此关联形成一份有价值的统计报告。当农夫山泉的每月数据枳累到达3TB时,这样的速度导致农夫山泉每个月财务结算都要推迟一天。更重要的是,胡健等农夫山泉的决策者们只能依靠数据来殷证以往的决策是否正确,或者对已出现的问题作出纠正,仍旧无法预测未来。2011年,SAP推出了创新性的数据库平台SAPHana,农夫山泉则成为全球第三个、亚洲第一个上线该系统的企业,并在当年9月宣布系统对接成功。胡箧选择SAPHana的目的只有一个,快些,再快些。采用SAPHana后,同等数据量的计算速度从过去的24小时缩短到了0.67秒,几乎可以做到实时计算结果,这让很多不可能的事情变为了可能。这些基于饮用水行业实际情况反映到孙小群这里时,这位SAP全球研发的主要负责人非常兴奋。基于饮用水的场景,SAP并非没有案例,雀巢就是SAP在全球范围长期的合作伙伴。但是,欧美兴旺市场的整个数据采集、梳理、报告已经相当成熟,上百年的运管经骏让这些企业已经能沉着面对任何突发状况,他们对新数据解决方案的渴求甚至还不如中国本地公司强烈。这对农夫山泉重事长钟目炎目炎而言,精准的管控物流本钱将不再局限于巳有的工程,也可以针对未来的工程。这位童事长将手指放在一台平板电脑显示的中国地图上,随着手指的移动,建立一个物流配送中心的本钱随之显示出来。数据在不断飞快地变化,好似手指移动产生的数字涟漪。以往,钟目炎目炎的执行团队也许要经过长期的考察、枪证,再形成-份报告提交给芭事长,给他几个备选方案,到底设在哪座城市,还要凭借经验来再做判断。但现在,起码从本钱方面已经一览无遗。剩下的可能是当地玫府与农夫山泉的友好程度,这些无法测量的因素。有了强大的数据分析能力做支持后,农夫山泉近年以30%TO$的年增长率,在饮用水方面快速超越了原先的三甲:娃哈哈、乐百氏和可口可乐。根据国家统计局公布的数据,饮用水领域的市场份额,农夫山泉、康师博、娃哈哈,可口可乐的冰虑,分别为34.楞.16.巡、14.3%.4.7%,农夫山泉几乎是另外三家之和。对于胡健来说,下一步他希望那些业务员搜集来的图像、视频费料可以祓利用起来。获益的不仅仅是农夫山泉,在农夫山泉场景中积累的经骏,SAP迅速将其宏制到神州租车身上.“我们客户的车辆使用率在到达一定百分比之后出现瓶颈,这意味着还有相当比率的车辆处于空置状态,资源尚有优化空间。通过合作创新,我们用SAPHana为他们特制了一个算法,优化租用流程,帮助他们打破瓶颈,将车柄使用率再次提高了15%,w案例2;河迪达斯的“黄金罗盘,文一本刊记者咎慧昉编辑一房煜发挥你您的想象力,选择您认为可是的答案OOON1.MMiuMNN1.tMM1.IINiaMIIMINRIMIAIBBMN大数据可以给阿迪达斯带来利润吗?YESttJK:A.可以降低年存成本B.精准地感知到客户,息加收入C.用敏懈说话,ISDQ决策速度IiiiiiiiiiiiiiiivIiiiiiiiiiii)(Iiiiiiiiiiiinminn看着同行大多仍身陷库存泥潭,叶向阳庆幸自己选对了合作伙伴。他的厦门育泰贸易有限公司与阿迪达斯合作巳有13年,旗下拥有100多家阿迪达斯门店。他说,“2008年之后,库存问题确实很严重,但我们合作蟀决问银,生意再次回到了正轨。”在最初降价、打折等清库存的“应急措施-结束后,基于外部环境、消费者调研和门店销售数据的收集、分析,成为了将同迪达斯和叶向阳们引向正轨的“黄金罗盘”。7000.(055%IM入攵IMH.心1400.f900,tMJ.9-9»014现在,叶向阳每天都会收集门店的销售数裾,并将它们上传至阿迪达斯。收到数据后,阿迪达斯对数据做整合、分析,再用于指导经销商卖货。研究这些数据,让阿迪达斯和经销商们可以更准确了解当地消费者对商品色、款式.功能的偏好,同时知道什么价位的产品更容易被接受。阿迪达斯产品鼓丰富,过去,面对展厅里各式各样的产品,经销商银容易按个人偏好下订单。现在,阿迪达斯会用数据说话,帮助经销商选择最适合的产品。首先,从宏观上看,一、二线城市的消费者对品牌和时尚更为敏感,可以重点投放采用前沿科技的产品、运动经典系列的服装以及设计灯合作产品系列。在低浅城市,消费者更关注产品的价值与功能.诸如纯棉制品这样高性价比的产品,在这些市场会更受欢送。其次,阿迪达斯会参巡经销商的终端数据,给予更具体的产品订购建议。比方,阿迪达斯可能会告诉某低线市场的经销商,在其辖区,普逋跑步鞋比添加了裱震设备的兔鞋更好卖;至于颜色,比起红色.当地消海者更偏爱残色。推动这种订货方式,阿迪达斯得到了经销商们的认可。叶向阳说:“我们1.起商定卖哪些产品、什么产品又会热卖。这样,我们将来就不会再遇到库存问题。"挖挹大数据,让阿迪达斯有了许多有座的发现。同在中国市部,那里局部城市受香港风气影响非常大;而另一些地方,消费者更愿意追随韩国潮流。同为一线城市,北京和上海消费挂势不同,气侯是主要的原因。还有,高线城市消费者的消费品位和习惯更为成熟,当地消费者爷要不同的服装以应时不同场合的需要,上班、吃饭、喝咖啡、去夜店,需要不同风格的多套衣服,但在低线城市,一位女性往往只要有应对上班、休园.宴请的三种不同风格的服饰就可以。两相比照,高线城市,显然为阿迪达斯提供了更多细分市场的选择。实际上,对大数据的运用,也I旗应了阿迪达斯大中华区战略转型的需要°库存危机后,阿迪达斯从“批发型”公司转为"零售驱动型”公司,它从过去只关注把产品卖给经捎商,变成了将产品卖到终端消费者手中的有力推动者。而数据收集分析.恰恰能让其更好地帮助经销商提高售想率。“我们与经辆商伙伴展开了更加紧密的合作,以统计到更为确切可靠的终端消费数据,有效帮助我们重新定义了产品供应组合,从而使我们在适当的时机,将符合消费者口味的产品投放到相应的区域市场。一方面降低了他们的库存,另一方面增加了单店捎售率。卖得更多,售魅率更高,也意味着更高的利润。"阿迪达斯大中华区童事总经理高嘉礼对大数据的应用成果颇为满意。案例3:数据权之争文一本刊记者周恒星编辑一杨靖发挥你您的想象力,选择您认为可是的答案OOOI1.1.1.1.1.1.1.1.imi1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.IBIIIII中国政府未来会开放敢摆吗?YES结果:A.美国政府的数据开放平台提供了成功的圾船B.中国企业对政府数雷的巨大Ie求C.新一届政府会更务实更市场化uniIiiiiiiiiiiIiiiiiiiiiiiiiiiiiiiIiiiiiiiiiiiiiiiiiiiii拥有了数据就等于夺取了行业制高点,飞友网络科技公司CEo郑洪窿深知个中道理。最近几年,刑若移动互联网的兴起,一类关于航班动态的应用程序开始出现。通过一套算法,数裾工程师们将机场航班实时动态转换成直观的信息,再传通给用户,让后者能够及时了解到航班的起飞、到达、延误、取消、返航、备降等状态,从而帮助用户更高效地安排行程方案。目前这个市场上主要有三款应用产品,分别是航班管家、飞常准和航旅蚁横,飞富准正是飞友科技推出的一款应用。三款应用中,航班管家和飞常准都是民营企业,上线时间较早,用户数较多;航虚纵横虽然上鼓最晚,却是由央企中国民航信息集团(中航信)开发,大有后来居上的趋势。随着这个细分市场呈现三足鼎立的局面,一个问题浮出水面。郑洪搂向中国企业家直言,数裾是这个行业最重要的资源。但是目前中肮信垄断了大局部行业信息,使得飞常准必须通过购置和交换才能获得自己所密要的数据。I1.1.1.1.1.1.1.1.1.iui1.M1.1.1.iui1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.imiMmiui1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.H1.1.1.iai1.1.1.1.1.1.1.1.1.1.1.1.t1.1.ini1.1.1.1.1.1.1.1.1.1.1.1.1.iui1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.M1.1.1.iui1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.B1.1.1.1.M1.1.M1.IIIIII依托英国政府数据平台进行创业的企业OPENCORPORATES整合全球企业信息P1.ACR按合位置与数据1.OCATAB1.E向用户免费提供查询服务董科朱呼:中0金根公升“我们的数据本钱是非常高的°.郑洪峰告诉本刊,“气象、航班信息、空域流量等信息有些是公开发布的,有些则需要公司向空管局、机场和航空公司购置或交换。"对于郑来说,获取数据的过程就是一部血汗创业史。据其回忆,早年的各大机场、航空公司之问的数得是割裂的,为了获得准确的航班起降信息,郑洪峰和他的团队就去为这些政府机构、大公司提供技术支持,以此来交接所需要的数据。“我们必须放下身段,他们需要什么我们就做什么。”郑说道。因为飞常准是家小公司,决或链条短,效率高,通过多年的积累,郑洪峰打通了局部数据通道。郑洪峰在民航系统工作近12年,其人脉和常识的积累成为飞常准的重要优势。1999年,他创立了民航农源网。现在,这家网站是中国最大的民航门户网站。2005年,他又创办了飞友,主要为飞行旅客提供机票搜索引擎等效劳。从2008年开始,郑洪峰团队通过飞常准为用户提供航班动态效劳。早期,飞常准的用户只是民航内部工作人员,很多机票代理商主动帮其推广,机场方面也常常用飞常准的应用来安抚因飞机奏误而愤怒不已的乘客,而业内资深人士也常提供很多有价值的反应信息。郑洪峰依靠民航内部的资源维持着自己的数据来源。但郑知道,这并不能长久。郑洪峰的故事并不是孤例。中国一家大型电子商务公司的数据挖掘专家接受本刊专访时提到,现在,越来越多的电子商务公司帘要预测非一线城市的物流状况。在这一过程中需要考虑当地交通拥堵程度和天气情况,如果当地政府可以提供这方面的相关数据,可以大大提商运作的效率.以交通数据为例,这位数据挖掘专家使用的是百度地图和尚德地图.后来,他发现不能再用了:一方面,与这样的公司合作存在商业机密问题:另一方面,由于交通数据可能来自于这些公司的统计,失真度也是这位数据挖掘专家担忧的。“我们非常希望政府能开放一些原始数据.”他继续说道,“我们也希望和领先者能平等地分享数据权,而不是数据本钱增加了二三倍。"郑洪峰和这位数据专家都担忧数据垄断,希望政府公平公开地开放数据,这样的做法并非没有借鉴。美国有一个叫做f1.yontime,us的网站,用户可以从这个网站上获得航班信息和天气情况,其功能与国内的航班动态应用类似。但是值得一提的是,这个网站的数据来源是一个公开的美国政府网站data.gov。目前在上面大约有超过40万各种原始数据文件,涵盖了农业、气象、金融.就业、交通、能源等近五十个分类。此外,data,gov还有一个地理信息的子站点,专门提供地理信息相关的数据。美国官方表示,这个网站的目的是“方便公众更便捷地获得联邦政府数据,并通过鼓励创新来突破政府的围堵而创造性皑使用这些数据。'2006年经济学家唐泰普斯科特(DonTapscott)£维基经济学书指出,人类巳经进入了共享时代:”失败者创立的是网页,而胜利者创立的是生机勃勃的社区:失败者创立的是有墙的花园.而胜利者创立的则是一个公共的场所;失败者精心守护他们的数据和软件界面,而胜利者则将资源与每个人共享。”这一理念后来被认为是网络2.0时代的核心理念。以用户为中心,注重用户交互,让用户参与共同速设的网络2.0同样适用于政府,最近几年各国政府的一系列举措标志若政府2.0时代的到来。那么在大数据叶代,中国政府做好准备了吗?深*的事实飞常准的竞争对手也遇到了相同的困境。为了拿到笫一手数据,航班管家非富卖力。它与各大机场合作,间接获得自己所带要的航班起降信息。2012年6月,航班管家与上海虹桥机场达成协议,航班管家可以直接从虹桥机场获得信息,包括戕班的妖误、取消以及登机口变更等一手信息,且提供的信息均与虹桥机场同步。可以预见,机场是其重要的数据来源,面对竞争对手的步步紧逼,郑洪峰认为,正常的商业竞争并不是飞常准所焦虑的事。“开放与竞争对我们来说是好事。"对于飞常准来说,央企中航信旗下的航旅纵横才是戢大的威胁。”在一定程度上,它有垄断数据的嫌疑。“一位坚持匿名的专家说道。而面对记者的采访要求,航旅纵横以不便透露为由拒绝。目前,中航信拥有中国所有终端旅客详细的数据库,包括姓名、手机、消费习惯等,这是中航信战核心的资源。由于与航旅纵横母子公司的关系,非市场化的利拄输送饱受诟病。在有关民航信息的关键数型中,空域流量是影响中国航班正点率的主要原因,而这一数据掌握在空管局手里。“空管局也愿意将数据分享给航空公司、机场,甚至是一些小公司,它们这么多年也在努力,可中国有自己特殊的情况。”上述专家说道。在中国,不到30%的空域5民航开放。和其它国家相比,中国是空域管制最为严格的国家之一。民航系统也很头疼,七成多的空域属于国家机密,所以机场、空域关闭根本无法预知,何来公开的数据?”上述专家说道。在航班信息中,准点率是非常重要的一条数据)郑洪搂以此比照中美两国差异。”在国外,像准点率这些关键数据都是由政府全部公开的,因为准点率会决定哪家航空公司可以获得哪些航境,是航段资源分配一个非常重要的参数。但是,在中国,这个数据却是各家公司自己授集的。"换句话说,相关政府部门并没有掌握到第一手的数据来源,遑论数据开放了.在石油、电信、铁路、民航等战略行业中,民航业的数据开放远远走在了其它行业的前头。上述电子商务公司的数据专家告诉本刊,设计物流工具时,他们更愿意与民航系统合作,不仅仅是快.还因为如果找相对封闭的铁路系统要一些关钺性数据,”更难,更不靠谱。.数据专家说道。“有时,政府电有担忧,你要数据做什么?有时他们第一反应是,何谋':第二反应是,你用来赚钱的,我会不会存在什么风险。”上述民航专家说。这位民航专家的一局部工作是为相关政府写内野报告,有时需要跟民航系统要一些关键性数据,即便如此,也免不了遭遇相关政府部门的疑心。中国传媒大学教授沈浩认为,现在的政府网站许多都是空架子,甚至大局费网站都很少更新,内容上也只是一些公告,而之前的决策过程并没有反映出来;与此同时,由于中国政府缺少推动力,尚无法建立像data,gov的数据平台。另外,根据BYET商学院对中国玫府部门的调查分析显示,政府部门以数据分析作为决饿支撑并没有形成气候,将数据分析作为核心竞争力的只占5.6%,比起美国和英国等政府开源力度差距巨大。此项调查的负责人,BNET商业英才网副总编周安利认为:政府部门依然缺乏对大数据的真正、全面的认识。在挖掘信息系统价值方面,数揖分析也受制于管理体制和职能制约,及长期传统管理积累的习惯,业务驱动力缺乏,绩效考核不配套。所以中国政府部门对大数据可能产生的价值,以及如何利用数据分析实现政府的科学决策依然有相当长的距离要走。数字生产力如今,飞常准已经拥有300万月活泼用户,覆盖1万个国内航班,5万个国际航班。郑洪峰直言,飞常准的优势和主要收入来源就是利用大数揖技术对数据进行收集、分析和加工。比方利用获得的收据,飞常准可以帮助保险公司制定航班延误保险,而这些都是政府和保险公司以前无法完成的。以前,航班延误险存在一个问题,就是保险公司让用户去举证,用户必须有各种各样的纸质证明才能从保险公司拿到赔偿,而赂偿金额往往只有两三百块钱,因此用户都不愿意买这个险。“而现在,航班一落地,通过我们的数据和效劳,保险公司就知道是否超过保险阀值,没超过的,用户可以直接从保险公司拿到钱,过程非常简单。”郑说道。与保险公司的合作,郑洪峰得到的回报是收取一小局部效劳佣金。数据开放不仅可以让小公司受克,而且可以让政府更加透明、负责任。美国玫府前助理信息官、纽约大学法学院教授贝丝诺维克(BethXOVeCk)在她的4维基政府运用互联网技术提高政府管理能力一书中阐述了如何在数字化背景下,运用网珞和大数据建立民主和高效的政府。“数裾开放可以让体制内外的人一起参与进来,解决政府无法完成以及帐手的问题。”诺维克告诉中国企业家。诺维克以感染率数据为例说明开放数据的作用。美国的医疗部门搜集了全美几乎所有医院的感染率,但是政府并没有足够的能力把这些数裾转化为有价值的信息.可是,当这些数据被放在data,gov网站上以后,微软和谷歌却能够运用自己强大的技术能力制作了1.幅数据地图。不管是研究机构或者是普通患者都能运用搜索引擎查找任何一家医院的感染率来决定是否住院。而在中国互联网领域,此前受到虚假广告质疑的百度也开始与相关政府部门合作,利用后者的数变进行网络打假。百度相关负责人告诉中国企业家,以前百度需要从2000亿网页中腾登出有问黑的假药网站,屏蔽虚假医疗信息非常困难,单纯依靠技术和管理手段的升级,难以到达打击假药的最正确效果。同叶,百度作为一家企业,并不具备相关监管资用,这也是百度无法进行独立打击假药的问题所在。百度曾独立打击假药,但效果十分有限。从2010年开始.百度联合卫生部、国家药监局等多个部委部门发起“阳光行动”,打击各类互联网不良及虚假信息,之后,百度与国家药监局正式达成战略合作,国家药监局的三大药品数据库,总计20余万个权威药品信息向百度开放,而且这些数据库将随着药监局的数据变化实时更新。用户可以通过通俗的葭品名、专业的药品名、批准文号等多个途径,在百度搜索到药品的权威信息。“作为5亿网民的互联网入口,百度一直以来都希望能利用搜索人口和平台优势,与各家具有数据资源优势的政府部门、权威机构联手,让权威信息全面入驻网络。”这位负责人说道.“重要的是,数据治国,相关政府部门也获得了很好的赞誉。”中国传媒大学教授沈浩认为,虽然中国玫府在2007年就发布了政府信息公开条例,但目前政府公布的数据大局褂还是报告和报表,没有标准的格式,不能以数据的形式查到,因此也无法进行深入的分析、加工和挖掘。“如果玫府需要社会共享和分析这些数揖,必须提供最原始的数据,这样的覆裾学术和商业上才能去应用它。"沈浩说,"你看data,gov的网站,在上面的联邦政府的数据库,都是以电脑可读取的格式发布的。”郑洪峰也意识到这个难题,他有时候会绐相关政府、大公司提供一些数据,他力求寻找一柠标准格式。而在这样的方向上,中国的一些公司也在与政府一起努力。高德软件有限公司三维应用事业部总经理赵珂告诉记者,以前的工程往往是政府立项再雇用公司去做,完成后玫府拥有版权,这样导致敕据市场不是市场经济而是投资拉动型的经济。而目前高德与地方测绘局采取的合作形式是授权模式,尚德钿助政府采集数据。拥有了标准化的数据,相关政府就拥有了一个标准的基础敕据库。“这是国家测绘局比较有远见的一个举措,相信我们未来和政府这类合作会越来越多。”赵珂说。郑洪峰也相信,未来会更务实更市场化,歧视性的东西会越来越少。中国的数据会越来越开放,也会更加利用市场的机制去鼓励更多的商业用户用好航班的数裾%与此同时,郑洪峰也在以不同形式回慎于给他提供数据的政府相关部门和大公司,政近,他的团队正在撰写-份报告,名为航班正点提高率方案。案例4:纸牌展你学不会发挥你您的想象力,选择您认为可是的答案OOOH1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.inin中国能制作出类纸牌屋的电视剧吗?NO结果:A.没有系统性的数据积累、分析和挖掘习惯B.广告模式不足以覆盖全部成本C.内容需要一定的程序审核I1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.imi1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.iun文一本刊记者伏昕编辑.杨靖凭借一部片子咸鱼翻身,这样的桥段在当下热播美剧纸牌屋身上重演,反转剧主角是美国一家视频公司NetfIiX,它的武器则是大数据。首次进军原色剧就走红,NetfIiX不仅成为娱乐圈里的谈资,亦成为数据革命的代表.无论是纽约时报3、C洛杉矶叶报还是最近一期的线济学人,严肃媒体们都在重要版面研究纸牌屋成功之道。获得如此密集关注,并非没有道理。纸牌屋不仅是Netf1.iX网站上有史以来观看量最高的剧集,也在美国及40多个国家大热。NetfIiX产品创新苗:总裁托德耶林(TOddVe1.in)称,其表现甚至“比我们最大妲的梦想都要好”。ANfTF1.IXOItIG1.NA1.SfRKSHQUSE三oCARDS事实是,美国“白宫聚娘传"、导演大卫芬奇(DaVidFinChCr)和老戏骨凯文史派西(KevinSpacey),这些晡头只是用以吸引眼球的皮毛。最抓人的是,Netf1.ix根据数据技术推导出妙牌屋的关键要素,再欢BBC剧、大卫芬奇和凯文史派西的用户存在交案,这是多么酷的一件事。中国的乐视网一直关注Notf1.iX的开展路径。“值得研究的是XCtfIiX如何从后端数据推导出前台生产。“乐视网副总裁何风云说。这种做法与旧传统是背道而驰的.以美国著名的有线电视网络媒体公司HBO为例,它对导演强烈的个性抱以完全的信任,全权委任导演去制片、编剧、挑选演员。而在中国,几大视频网站在自制剧时都有自己的选片团队,由他们为观众选择与馥定导演,挑选剧本。H二二,H丁v#-5二一5能一&01.h1.÷I工郴多年前,依族于种种技术,NetfIiX对数据的记忆能力已经炉火纯青。当一位用户通过浏览器登录NetfIiX账号,Netf1.iX后台技术将用户位置数据、设备数据悄悄地记录下来。这些记忆代码还包括用户收看过程中所做的收藏、推荐到社交网络等动作。在NetfIiX看来,暂停、回放、快进、停止等动作都是一个行为,每天用户在etf1.ix上将产生高达3000多万个行为,此外Netf1.iX的订阅用户每天还会给出400万个评分,300万次搜索请求,询问剧臬播放时间和设备。没错,这些都被Netf1.iX转化成代码,当作内容生产的元素记录下来.其首席内容官泰德表示,所有这些数裾意味«.NetfIiX公司巳经拥有“可寻址的观众”。早年阿,NetfIiX利用上述数裾提供一项推荐引擎业务。比方说,数千万用户能在一个个性化网页上对影片做出1-5的评级,这些评级构成了一个巨大数据池,如今这个数据池容量已超过近百亿条。根据数据池,NrfIiX使用推荐算法来识别具有相似品味的观众,然后对这一群体做出相关内容的精准推荐。NetfIiX要将巨大的数据池变为生产力并非易事。常年以来,为了提高算法精准,它持钱地举办大型比赛,来提高自己的数据挖挹能力。2005年底,NetfIiX曾开放一数据集,并设立百万美元的奖金Seif1.ixprize),征集能够使其推荐系统性能上升10%的推荐算法和架构。这个数据集包含了超过48万个匿名用户对大约近2万部电影做的大约10亿次评分。Netf1.ix1.宜在寻找与自身匹配的数据挖掘工具。得一位前Netf1.ix云数据库架构师的博客回忆,在2010年Netf1.iX完成了两次迁移,其一是将NetfIiX的数据中心迁移到了AmaZOnAWS之中,其二是将OraCIe数据库迁移至SimP1.eDB。而到了2011年又从SinIPIeDBif移到CaSSandra,利用CaSSandra提供的落由配置,集群可以被部署在多个大洲.忘掉上述专业术语,一个小故事足以说明它们的意义。法国电影不要告诉任何人在美国的票房收入惨淡,只有600万美元。可Netf1.iX的工程师并不相信这个数字,他们通过上述数裾挖掘技术,找到了不易发觉的点击量.而这些才是被隐藏的事实。2011年时,NetfIiX决定播放不要告诉任何人。如NetfIiX预测的一样,这部电影在播放后立即在最受眼目的节目中排到第四位。然而,投资人并不看好Netf1.iX的这些努力。投资人外表上相信Netf1.iX的数据库是个大宝藏,但财务报表的软裾呢?去年万圣节.Netf1.iX蒙事长疑CEO里德哈斯延斯接到一位投资人电话,后者告知哈斯廷斯,他将从二级市场收购Netf1.iX10%的股份。投资人坚持认为Netf1.iX气数已尽,这位投资人的方案是,进入Netf1.ix董事会再建议哈斯廷斯卖掉Netf1.ixo早期,Ne1.f1.ix是北美家喻户晓的在埃影片租赁提供商,它的主营业务是通过邮寄方式租赁DVD的模式赚取利润。然而,在互联网时代这个盈利模式逐渐式微。于是,NetfIiX将主营触向在线流媒体播放,其商业模式是付费用户逋过PC、TV及iPad、iPhone收看电影、电视节目。但在逐步放弃高利涧率的DVD业务,彻底转型低利润率的流媒体业务后,NeIfIiX却遭遇营收增速放缓、本钱费用激域的困境。2012年第三季度,尽管财报中营收和每股收益均超出分析师预期,股价却依然暴跌。美国如名专栏作家撰文称“Netf1.ix被收购或许才是投资者坡理想的选择”。里德哈斯廷斯别无选择。他决定还击投资人的短视,用事实告诉资本市场,数据不是花架子,而是地道的生产力。NeIf1.iX利用数据挖棉能力计算出可以羸的方法,1亿美元买下一部早在1990年就播出的BBC电视剧纸牌屋的版权,请来导演大卫芬奇(DaVidFincher),并由老戏骨凯文史派西(KevinSpacey)担当男主角。乐视网副总裁何凤云向本刊介绍,1亿美元买下的纸牌屋总共2李26集,计算下来单集本钱约为400万美元,远远高于美国一般电视剧的单集制作成本一一150万至200万美元,也只有色广告狂人、斯巴达克斯这类热播美剧才能到达200万美元左右。算下来,对于NetfIiX而言,只有新增100万一年期合约付费用户才能收回上述本钱。XetfIiX并非没有计算过豪赌的回报,这样做不仅可以带来新增用户,更为重要的是它为NetfIiX开拓了上游市场.走上了自制剧之路。在纸牌屋之后,还将有四部自制剧在2013年登陆比tf1.ix.这意味着,Xetf1.ix可以逐步降低对版权费用日趋高涨的好莱坞剧的依减。NetfIiX的故事,对于中国视频网站而言着实励志。他们与NetfIiX所面临的境遇相似:在美国国内,好莱坞的独家授权费用越来越高,版权成本上升导致资本开支加大。同时内容竞争越来越剧烈,尽管在流媒体播放领域Netf1.iX仍占据市场首位,但面临若HB(H美国家庭电视播送网)、Amazon(亚马逊)、Hu1.u、YOUTUbe的竞争,它们都在加大内容投入。由于版权价格提升,国内知名的视频网站们,诸如优酷土豆、搜狈视频、乐视网、爱奇艺近两年也纷吩打造自制剧。据乐视网高级副总裁高飞对本刊透露,虽然去年上半年版权价格皆达冰点,但是现在又很快上升,从一线卫视购置电视剧,平均购置价格每集几十万,意味着买下一整部剧不下千万。在此同面下,拿下抵牌屋中国地区的互联网独家播放权的搜狈视频,不再不上调版权采购预算,其2012年的版权采购本钱为5000万美元,但2013年这一预算上调到8000万美元。“但我们拍一个自制剧,本钱根本上也就三分之一,甚至不到