基于移动通信数据的居民出行调查技术规范.docx
《基于移动通信数据的居民出行调查技术规范.docx》由会员分享,可在线阅读,更多相关《基于移动通信数据的居民出行调查技术规范.docx(19页珍藏版)》请在课桌文档上搜索。
1、ICS 93. 080. 30CCS Q 84贵 阳DBXXXX市地方标准DBXXXXTXXXXX-XXXX基于移动通信数据的居民出行调查技术规范点击此处添加与国际标准一致性程度的标识(征求意见稿)2023 -XX-XX 发布2023-XX-XX实施贵阳市市场监督管理局发布前言II1范围I2规范性引用文件13术语和定义14总体要求35数据采集与处理35.1 数据采集35.2 数据处理46居民出行特征提取与统计46.1 基本要求46.2 驻留与出行识别463人口与岗位识别56.4 出行目的识别56.5 出行量与出行率66.6 出行时耗与出行距离66.7 出发时间分布与出行空间分布66.8 通勤出
2、行特征66.9 其它出行特征77扩样和校核77.2校核7调查成果形式与内容8附附附录A9录B10录C12本文件按照GB/T1.1-2020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。本文件由贵阳市交通委员会提出并归口。本文件起草单位:贵阳市交通发展研究中心、昆明理工大学、中国联合网络通信有限公司贵州省分公司.本文件主要起草人员:钟宇、何明卫、成国积、石庄彬、吴杰、何莉、帅春燕、刘阳、刘杰、刘甜甜、廖强、郑和标。本文件为首次发布。基于移动通信数据的居民出行调查技术规范1范围本文件规定了调查内容、数据采集与处理、居民出行特征提取与统计、调查成果形式与内谷本文件适用于利用移动通信数
3、据进行居民出行调查分析等工作。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T35273信息安全技术个人信息安全规范3术语和定义下列术语和定义适用于本文件。3. 1手机信令mobiIesignaling移动通信系统中,用来传输用户信息和保障正常通信所需的设备与网络之间的协议控制信号。3.2手机信令数据mobilesignalingdata移动通信用户在发生通话、收发短信、位置移动或上网等事件时,与运营商的通信基站之间发生信息交换所产生的
4、数据。3.3基站basestation在一定的无线电覆盖区中,通过移动通信交换中心,与移动通信终端之间进行信息传递的公用无线电收发电台。3.4加密移动用户识别码encryptedmobiIesubscriberidentification基于手机信令的数据处理及服务中唯一标识信令所属移动用户的识别码。3.5静止冗余数据staticredundantdata同一持卡人的每个时间戳对应的基站编号以及基站经纬度均相同的手机信令数据。3.6乒乓切换数据ping-pongswitchingdata移动通信系统中,由于基站信号强度会随时间发生变化,移动通信用户所持有的手机可能在临近的两个基站间来回切换,进
5、而产生乒乓切换数据。3.7基站漂移数据basestationdriftdata由于地形、建筑物等对基站信号的遮挡和反射效应,导致移动通信用户的基站位置忽然切换到较远的基站,一段时间后又切换回临近基站,在此过程中产生的基站漂移数据。3.8驻留点stoppoint移动通信用户在某个超过最小停留时长的连续时间范围内,与其发生信号交互的基站位置满足驻留空间限制时,将这些基站位置的质心视为该用户的驻留点。最小驻留时长和驻留空间限制应根据具体应用场景而定。3.9驻留Onestop移动通信用户在满足驻留空间限制的某一区域内连续停留超过最小驻留时长。3.10驻留空间stopspace移动通信用户驻留时间内与其
6、发生信号交互的多个基站所覆盖的区域可合并为一个驻留空间区域。3.11驻留时长stoptime移动通信用户在某一驻留区域从驻留开始时间到驻留结束时间的时间长度。3.12驻留人数stopnumber给定统计时段,在某一空间范围内累计驻留时长超出给定阈值的不计重移动通信用户数量。3.13出行trip移动通信用户按照时间的先后顺序,从一个驻留点(0点)移动到另一个驻留点(D点)的过程。3. 14单日夜间驻留地single-daynightresidence移动通信用户单日在夜间时段累计驻留时长最长的某一位置记作夜间驻留地。3.15单日夜间驻留人数numberofsingIe-daynighttimer
7、esidents夜间时段在目标区域单日夜间不计重的驻留移动通信用户数量。3.16单日日间驻留地single-daydaytimeresidence移动通信用户单日在日间时段累计驻留时长最长的某一位置记作日间驻留地。3.17单日日间驻留人数numberofsingle-daydaytimeresidents日间时段在目标区域单日日间不计重的驻留移动通信用户数量。3.18核查线screenIine结合交通分析和交通模型的需要在调查区域内设置的交通流量调查的分隔线,一般结合天然或人工屏障(铁路、河流等)设置。4.1 基于移动通信数据的居民出行调查对传统的居民出行调查起到辅助作用,并不能取代传统的居民
8、出行调查。4.2 基于移动通信数据进行居民出行调查应包括数据采集与处理、居民出行特征提取与统计、扩样和校核等工作。4.3 居民出行特征提取与统计应包括驻留与出行识别、人口与岗位识别、出行目的识别以及出行率、出行量、出行时耗、出行距离、出发时间分布、出行空间分布、通勤特征等出行特征的统计分析。可根据研究需要增加城市出行联系、重点区域出行分析、轨道交通出行分析等内容。4.4 涉及重要居民出行特征指标应基于不同尺度的空间单元分别进行统计和分析。可采用行政区(县)、街道或组团、交通小区、空间栅格的层级方式,并说明不同尺度空间单元的从属关系。4.5 应采集调查区域内至少连续1个月的手机信令数据。4.6基
9、于移动通信数据进行居民出行调查分析工作应遵守国家有关法律法规关于数据安全方面的要求,具体说明见附录A。5数据采集与处理5.1 数据采集5.1.1 移动通信数据的采集应符合下列规定:a)移动通信数据源应至少选择一家移动通信运营商在调查周期内的完整数据;b)若同时采集多家移动通信运营商的数据,宜采用相互比较、相互校核的方法来提高分析结果的可靠性;C)所采集移动通信数据的类型、格式和内容见附录B。5.1.2 基站数据建议包括以下字段和内容:a)基站编号;b)基站所属运营商标识;c)基站所在位置的省份标识;d)基站所在位置的城市标识;e)基站类型,包括普通基站、地铁基站、铁路专用基站、地上基站与地下基
10、站等;f)基站地理位置的经度数值,至少精确到小数点后6位;g)基站地理位置的纬度数值,至少精确到小数点后6位。5.1.3 手机信令原始数据建议包含以下内容:a)加密移动用户识别码;b)信令时间戳,数据格式建议统一为:YYYY-MM-DDHH:MM:SS形式;C)信令事件类型代码:开关机、语音呼叫、短信、周期性位置更新、切换基站,以及不同通讯时代(2G至5G)间切换的位置区更新等事件类型的标记;d)经度:当前所在基站的地理位置的经度数值,至少精确到小数点后6位;e)纬度:当前所在基站的地理位置的纬度数值,至少精确到小数点后6位。5.1.4 用户基本特征数据建议包含以下字段内容:a)加密移动用户识
11、别码;b)用户年龄范围区间;C)用户性别;d)用户手机话费套餐费用区间;e)号码归属国家、省及城市。5.2 数据处理5.2.1在使用数据前,应先进行数据质量检查。检查内容包括对信令日变和时变检查、对基站位置坐标检查以及检查不同类型区域中基站的布局密度是否处在合理范围等。5.2.2对采集到的手机信令原始数据,应识别并剔除其中物联网卡等非人号卡产生的信令记录。剔除物联网卡等非人号卡要根据物联网特殊号段以及从移动用户识别码获取的设备类型等进行处理。5.2.3当条件满足时,应进行一人多卡去重,可通过计算多个加密移动用户识别码的轨迹重合度进行处理。5.2.4数据清洗包含但不限于以下处理流程:a)残缺数据
12、筛除;b)重复数据的合并处理;c)静止冗余数据的合并处理;d)乒乓切换数据处理;e)基站漂移数据处理。5.2.5手机信令记录中残缺数据处理可分为以下两种情况:a)当手机信令记录的缺失值为关键字段时,如用户识别码、信令时间戳,应删除包含缺失值的手机信令记录;b)当手机信令记录的缺失值为非关键字段时,如信令事件类型代码,可采用插补方法对缺失值进行处理.5.2.6当手机信令原始数据存在数据字段内容完全相同的重复数据时,需对原始信令数据合并去重,保留重密数据的第一条数据。5.2.7应对信令记录中的静止冗余数据进行合并删除,保留连续在同一位置的第一条和最后一次信令交互数据。5.2.8在手机信令记录中,宜
13、以用户在“乒乓效应”发生期间连接次数最多的基站为主基站,剔除“乒乓效应”期间产生的除主基站外的记录,完成对乒乓切换数据的清洗。5.2.9信号漂移数据处理应根据同一用户每条信令记录的停留时间、停留位置及其下一条记录的停留时间、停留位置,计算每次移动的速度,通过设定速度阈值,剔除短时间内发生大位移的信令记录。6居民出行特征提取与统计6.1 基本要求6.1.1 应建立基站位置与基本空间单元之间的对应关系,基本空间单元宜采用空间栅格或交通小区。6.1.2 基本空间单元的大小应结合基站密度合理确定,当采用空间栅格形式划分空间单元时,建议在中心城区划分为250m*250m或500m*500m尺寸的栅格,外
14、围区可根据基站密度适当扩大。6.2 驻留与出行识别6.2.1 驻留状态识别需确定合理的最小驻留时长和驻留空间限制。最小驻留时长和驻留空间限制的取值应考虑实际应用场景。6.2.2出行状态识别需根据驻留状态的识别结果进行判断,具体可通过移动通信用户两次相邻驻留状态之间的空间移动过程进行识别。6.2.3通过对用户驻留状态期间记录的手机信令数据的基站位置综合加权来确定移动通信用户的驻留点。6.2.4移动通信用户驻留指标应包括驻留时长、驻留人数、单日夜间驻留人数、单日日间驻留人数。6.2.5夜间时段内当用户在某一位置驻留时间不少于连续六个小时,则将该位置标记为用户的夜间驻留地,夜间时段可依据季节进行确定
15、,可取21:00至次日7:00。6. 2.6日间时段内当用户在某一位置累计驻留时间不少于六个小时,则将该位置标记为用户的日间驻留地,日间时段可取10:00至17:00。6.3 人口与岗位识别6. 3.1居住地识别宜根据下列内容展开:a)统计单个移动通信用户在整个统计周期内所有单日夜间驻留地出现的频次,可采用频率最高的单日夜间驻留地,作为该用户的居住地。根据具体需要,可进一步区分第一居住地和第二居住地;b)用户居住地识别过程中应设置有效性判断规则,建议被识别为居住地的单日夜间驻留地在整个统计周期中重复出现的频次不少于调查周期天数的50%;c)居住地识别也可根据调查目的和数据统计周期长度结合单日夜
16、间驻留地累计时长、单日夜间驻留地重复率加权取值进行判断。7. 3.2就业地识别宜根据下列内容展开:a)统计单个移动通信用户在整个统计周期中所有工作日单日日间驻留地出现的频次,可采用频率最高的工作日单日日间驻留地,作为该用户的就业地;b)用户就业地识别过程中应设置有效性判断规则,建议被识别为就业地的工作日单日日间驻留地应在整个统计周期中重复出现的频次不少于调查周期天数的50%;c)就业地识别也可根据调查目的和数据统计周期长度结合工作日单日日间驻留地累计时长、工作日单日日间驻留地重复率加权取值进行判断。8. 3.3关于常住人口的识别,应筛选出用户在夜间驻留天数最多且大于给定阈值(建议设置为调查周期
17、天数的50%)的所在区域作为该用户的常住地,将该用户归为所在区域的常住人口。9. 3.4短期驻留人口识别宜根据下列内容展开:a)用户在该城市范围内单日连续驻留3小时以上,且不属于该城市常住人口的,计入该城市的当日短期驻留人口计算对象,一个用户按城市纳入不计重;b)不在同一天内同时停留的短期驻留用户不能累加,宜采用的方法是在三十日内逐日计算符合短期驻留规则的人数,计算日平均值,以此作为所在区域的短期驻留人口。6.4 出行目的识别6. 4.1居民出行目的可分为通勤出行和非通勤出行。可结合调查工作需求,根据移动通信数据信息的完整程度和数据时空精确程度对居民出行目的做进一步的细分。7. 4.2居民出行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 移动 通信 数据 居民 出行 调查 技术规范
链接地址:https://www.desk33.com/p-557919.html