百度地图所用数据分析.docx
栅格模型(瓦片模型):用方格来摹拟实体我们目前在互联网公开服务中,或者绝大多数手机APP里看到的,都是基于栅格(瓦片)模型的地图服务,比如大家看到的百度地图或者谷歌地图,其实对于某一块地方的描述,都是通过10多层乃是20多层不同分辨率的图片所组成,当用户进行缩放时,根据缩放的级数,选择不同分辨率的瓦片图拼接成一幅完整的地图(由于普通公开服务,瓦片图都是从服务器上下载的,当网速慢的时候,用户其实能够亲眼看到这种不同分辨率图片的切换和拼接的过程)对于矢量模型的电子地图来说,由于所有的数据以矢量的方式存放管理,事实上图层是一个比较淡薄的概念,因为任何地图元素和数据都可以根据需要自由分类组成,或者划分成不同的图层。各种图层之间关系可以很复杂,例如可以将所有的道路数据做成一个图层,也可以将主干道做成一个图层,支路做成此外一个图层。图层中数据归类和组合比较自由。而对于栅格模型(瓦片图)来看,图层的概念就很重要的,由于图层是生成制作出来,每一个图层内包含的元素相对是固化的,因此要引入一个底图的概念。也就是说,这是一个包含了最基本,最常用的地图数据元素的图层,例如:道路,河流,桥梁,绿地,甚至有些底图会包含建造物或者者其他地物的轮廓。在底图的基础上,可以叠加各种我们需要的图层,以满足应用的需要,例如:道路堵车状况的图层,卫星图,POI图层等等。底图通常是通过选取必要地图矢量数据项,然后通过地图美工的工作,设定颜色,字体,显示方式,显示规则等等,然后渲染得到了(通常会渲染出一整套不同分辨率的瓦片地图)固然,即便在瓦片图的服务中,在瓦片底图之上,依然能够覆盖一些简单的矢量图层,例如道路走向(导航和路线规划必用),POI点图层(找个饭馆加油站之类的)。只无非瓦片引擎无法对所有地图数据构建在同一个空间数据引擎之中,比较难以进行复杂的地图分析和地图处理那末既然瓦片图引擎有那末多的限制和缺陷,为什么不都直接使用矢量引擎呢?因为瓦片图引擎有着重大的优势:1.能够负载起大规模并发用户,矢量引擎要耗费大量的服务器运算资源(因为有完整的空间数据引擎),哪怕只是几十上百的并发用户,都需要极其夸张的服务器运算能力了。矢量引擎是无实地外采:说白就是测绘人员利用专业的仪器仪表,在实地环境中测绘所得到的。这样的采集方法耗时耗人都非常厉害,一则成本高,二则周期长,三则是采环境要求高(去喜马拉雅山去测测能弄吐血了),而且未必能够彻底跟得上中国现在的城市变化。但是优点在于精度高,置信度,准确度非常高。这是国家测绘部门主要采用的手段,对于像北京市这样一个城市来说,普通几年才会完整重新测绘一轮。普通对于大多数商用测绘时,只是用在少数局部需要时,重点测绘才用得到。该也偶尔能见到固然,在精度和准确度要求没有那末高的地方,实地采集也可以使用一些成本更低更便捷的工具,而不是专业测绘设备。例如用携带高精度GPS或者其他定位的手持智能设备步行以绘制轮廓等。航片卫片制作:就是通过自己拍摄或者购买的高精度航空照片或者卫星照片或者遥感照片,在此作为底片的基础上进行人为的矢量标注和勾勒,从而形成自己的矢量数据。现在的航片或者遥感片的精度已经可以很高了,普通来说做到精度在0.05米的程度已经很容易。高德自己的航片据说已经可以做到0.03米的精度,对于商用地图数据来说,通常已经够用了。即便作为国家权威测绘,在大量荒郊野岭的测绘,也主要依赖于这种手段。目前常用的航拍或者卫拍手段包括机载数码摄像,机载遥感以及三维激光扫描(主要用于3D地图数据采集)0.05米精度航片航片卫片标注和勾勒,前面是在底片上的操作,后面是勾勒标注后得到的矢量图数据加工制作示意图(来源于高德某公开资料)从这部份数据来说,百度是没有自己的采集生产能力的,也没有执照(没有测绘资质)。百度的这一块数据主要是向四维图新买的。国内这一块的数据,主要有两家供应商,就是高德和四维图新。四维图新和国家测绘单位的关系非比寻常,其数据依赖国家测绘单位供给的占大头(固然也有互相供给的)高德也有一部份数据来源于国家测绘单位的供给,但是高德自己的航拍制作的能力还是不错的(还承担过一些国家测绘机关的测绘任务),相对来说,依赖国家测绘单位数据的比例要低一些。总的来说,这部份数据的采集生产,在中国需要国家认定的资质,有资质的除了国家测绘机关以外,商业机构本来就不太多,而真正在这个数据供给市场上活跃的,现在主要就是高德和四维图新这两家。其他无论是谷歌地图也好,苹果地图也好,这部份的数据,基本上都是从上述两家购买的,2.P0I数据:严格来说属于矢量数据,无非是最简单的矢量数据,换句话来说就是坐标点标注数据。也是电子地图上最常用的数据图层。我们H常在电子地图上所使用的数据都是POl数据(就是地图上常见的那种标个气球的点)。POl数据只是信息关联坐标点的数据,不涉及到线和面,是最简单的矢量数据,用于简单的地点标注而不需要相应地物轮廓的需求。POI数据的内容五花八门,普通POl数据的供应商提供的Pol数据都是日往往用的场所数据,例如饭店,商店,加油站,银行等日往往用设施。固然,在一些特殊的地图应用领域,也可以委托这些数据供应商或者自行去专门采集特殊用途的POI数据,例如井盖,消防栓等税务GIS系统标注企业及纳税信息值得指出的是,Pol数据的编辑更新简单,同时也时常用于动态数据标注,最经典的莫过于车辆定位标注。POl数据的采集和生产来源五花八门,不能尽述,总的来说,主要有以下几种:a)通过整合GPS的摄像机,步行或者车行,进行扫街持续拍摄,回去以后,再根据拍摄结果手工进行输入和标注,这种方式适合于大规模的进行采集标注,效率高,成本低,车行居多,尤其适合沿街的店面和场所的采集和标注,是目前数据采集供应商的主要采集手段之一b)通过专职或者兼职人员,使用手持含GPS的智能设备(比如智能手机),进行拍摄(主要是为了取证),输入,提交,进行采集。这种采集方式,大多用于上述方法a的补充。在一些车辆不能达到的地方,或者商户设施变动频繁的某些区域使用C)地址反向编译:通过门牌地址号码,以及矢量地图中的道路数据,运用算法进行定位标注。这种标注精度相对最低,准确性也不高,但是成本非常低。用在不需要特殊高精度,成本控制也比较严的采集领域。大家在地图服务搜索框中输入地址门牌号,可以直接浮现标注点,用的就是这个技术。d)互联网或者企业获取:直接从一些专业类服务网站上抓取或者购买(例如大众点评,携程),或者直接从大家在其公开的地图服务上的标注中进行筛选和获取。这就是google,百度,高德自己免费向社会开放其地图服务所能够获得的利益。特别对于开放APl免费企业客户的使用,这种获取是很有价值的。国内PC)I数据的供应商没有太多资质限制,相对底图数据供应商,要多不少,例如图吧等都是POI数据供应商,固然四维图新和高德也提供POl数据,每一个POl数据供应商,都有其自己的分类方式,数据定义等内容。不少时候,大家也互相买来买去,互补有无。百度地图这方面的数据,主要来白四维图新和道道通,固然也有其他来源,甚至有少量的自产数据。高德地图这方面的数据以自产为主,辅以向一些专业服务商购买(口碑网,大众点评,携程,乐途,搜房)3.其他数据图层或者数据:常见的有卫图图层,交通状况图层,三维图,街景图。专业一些的领中ShS区市联合馆世博文化中心.,商圈分布图,地形图,水文图等等。域有楼盘图,室内图,气温分布图C I 1微观地图楼盘字典项目-楼幢市占图版权信息楼盘市占图-Bte质灾害信息管理系统王具起*吊标说美9字春海:人员或周时查课是别:灭君点查裨-吴孵:香族确定i*T.灾害点上传萩计分税1.j只古点按垸别统计*灾蹲点按他还统计点好结果fii5m月病蝴蝠髓点清坡:查:户Rfl此省暂无处份该誓无复份误KHiSTTWG曲传呼读统一嵋号425858020651JcoccrtcJf<Ce2MM3420626816084042(改60180558装0420626010007.似K60】Bo3.425826814010出42Q620H0114W”.42882851SOM,420626010015.420626010016420636310047出42Vtt)14916!MQ5W9M0W>420626514020429626914921UMWq名称观音岩潜共三溪海成火堤冷淤忧黄中里冲承施水竹城满族阳巩治林朝阳观搔装8靠沟滑抗二道河北面技管解东较重坡柳定较沿能力果KI沟童坡小Ja啷爱共承排子窗校驮沟滑块城西雷坡遽草沟沿旋事票柯做毒技女网两音共½Wtt.品池滑接地址灾害图电视有限网络分布管理图gMy*rtvw图人口密度图三维数据示意图之以贴这么多五花八门的图,主要就是为了说明,基于电子地图的数据图层真的是应用范围和应用领域极广,不同的图层,代表了不同的数据,这个领域有大量专业性的应用和数据,其采集方法,来源渠道也五花八门,难以尽述。简单说几种常用数据的来源:a)交通拥堵数据:这个普通来源于专业的数据供应商,这些供应商和交通部门有较深合作,其数据采集主要依赖于在出租车上安装的GPS来采集实时车速为主,或者通过摄像头,红外探头,雷达测速测量车速为辅b)三维数据:主要依赖激光扫描以及手工建模处理等C)假三维数据(那种不能旋转的45度三维鸟瞰图):依赖照片拍摄和材质帖纹手工制作。d)街景:依赖实采拍摄百度地图基本上惟独最基本常有的一些图层数据,例如部份三维数据,交通图层数据,卫片图层数据等,百度不具备这部份数据的采集和生产能力,都是向不同供应商外购的。德地图有一些专用数据,例如楼盘数据等,德在一些数据领域有采集和生产能力(例如三维数据等),可以根据客户的要求进行专业采集生产过程,提供专业的图层数据。无非一些特殊偏,特殊专业的数据领域(就像上面有的有电视网,地址灾害图)就需要应用者自己通过专业的工具进行制作了有不少特种数据图层是不能在瓦片图引擎上显示,或者在瓦片图引擎上显示是没有任何意义的。只存在于矢量引擎的应用。总结:百度的地图数据主要靠买,德地图数据以自己采集生产为主。就国内的情况来看,主要的数据都依赖于采集。这点和国外发达国家有比较大的差别。在国外发达国家,由于建设速度相对照较缓慢,政府的信息化水平以及信息透明做得较好,其实不需要那末多采集工作。这个行业内有句话,叫做国外(发达国家)以内勤为主,外勤为辅,国内以外勤为主,内勤为辅。由于地物变化相对照较缓慢,政府公开和发布的数据比较及时,透明,准确,可用,因此国外这个行业许多数据生产商直接拿政府发布数据做一下加工就可以了,改动的地方也不多,国内还比较依赖数据生产上自己采集。(举个例子,这里面比较典型极致的是日本,哪里新安装了一个红绿灯都会在政府网站上及时准确发布,并标注位置,更不用说楼盘建设,城市建设等大动作了,因此数据生产商拿这些数据来就可以直接用,很少需要自己去采集了)