京东数科JUST技术:利用迁移学习生成新城市的轨迹

作者:京东数科智能城市 JUST团队-何天赋
市民的出行轨迹数据无论是对于城市管理、规划 , 还是商业活动 , 都是重要的参考信息 。 然而 , 获取一个城市的人群轨迹数据却非常困难 。
在今年4月份召开的国际顶级互联网会议WWW 2020(CCF-A类)上 , 京东城市报告了被会议收录的论文《What is the Human Mobility in a New City: Transfer Mobility Knowledge Across Cities》 , 研究了如何通过迁移学习 , 根据一个城市的POI、路网、交通信息来推测它的人群轨迹分布 。
京东数科JUST技术:利用迁移学习生成新城市的轨迹文章插图
1. 背景城市人群出行所产生的轨迹信息是公共交通规划、城市基础建设、商业选址智能系统的重要参考数据 。 但由于隐私、商业保密和传感器部署预算等原因 , 想要得到城市大量的轨迹是非常困难的 , 尤其是对于一个新的、缺乏数据采集的城市区域 。
京东数科JUST技术:利用迁移学习生成新城市的轨迹文章插图
图 1
然而我们知道 , 一个城市的出行轨迹分布 , 与该城市的POI、公交、路网信息存在关联 。 那么 , 是否可以通过已有轨迹的城市区域 , 去学习这种关联 , 并将这种关联应用在目标城市上呢?这正是该工作所作的研究 。 正如图1示例 , 通过对已有轨迹的城市如北京、合肥进行出行知识建模 , 通过雄安的路网、POI、公交信息 , 得到雄安的轨迹数据分布 。
京东数科JUST技术:利用迁移学习生成新城市的轨迹文章插图
图 2
作者将出行的本质归为三个阶段(图2):1)产生出行意图、选择目的地和路线选择 。 顺着这个思路 , 该论文将新城市的轨迹生成问题拆分成三步:1)出行意图迁移;2)起始点-终点(OD)生成;3)路线生成 。
2. 出行意图生成由于不同城市的建设程度、规划风格存在差异 , 从源城市中显式学习到的出行规律 , 无法很好应用于目标城市 。 一个典型例子是 , 北京有大量从家到地铁站的短途出行需求 , 而小城市没有地铁站 , 就不存在家-地铁的出行模式 。 这就是各城市在显式特征空间中的分布不一致现象(图3左) 。
京东数科JUST技术:利用迁移学习生成新城市的轨迹文章插图
图 3
虽然显式出行模式不能直接应用在新的城市 , 但作者尝试找到一个隐空间 , 在这个空间里 , 各个城市的数据分布相近 , 通过源城市学习得到这个一致分布 , 并将其作为目标城市的分布(图3右)——这就是迁移学习领域的域泛化(Domain Generalization)思想 。
京东数科JUST技术:利用迁移学习生成新城市的轨迹文章插图
图 4
图4展示了出行意图生成模块的具体过程 。
首先 , 根据两个源城市轨迹的起始点终点 , 提取显式的特征——空间信息特征(Spatial Context Features) 。 提取包括了POI分布、起终点在路网中的拓扑特征、与公交站的距离等信息(图4b) 。
接下来 , 基于域泛化思想 , 从不同源城市OD点的空间信息特征中学习泛化函数G , 最小化G函数映射后源城市之间的分布最大平均差异 。 如图4c所示 , 通过学得的G映射函数 , 在G目标空间——出行意图空间(Mobility Intention Space)中 , 不同源城市的分布相近 。
最后 , 对出行意图空间中的数据进行建模 , 对出行意图分布建立生成模型(图4d) 。 根据作者在早期探查中的试验 , 从源城市得到的出行意图分布 , 与目标城市的出行意图分布也很接近 。 因此 , 该工作将源城市的出行意图分布直接作为目标城市的出行意图分布 。
3. 目标城市的起终点生成通过上一步 , 我们得到了出行意图空间的生成模型 , 产生目标城市的出行意图数据 。 但出行意图数据是隐空间数据 , 如何通过产生的出行意图向量 , 来算得目标城市真实的起终点?