京东数科JUST技术：利用迁移学习生成新城市的轨迹作者：京东数科智能城市JUST团队-何天

作者：京东数科智能城市 JUST团队-何天赋
市民的出行轨迹数据无论是对于城市管理、规划，还是商业活动，都是重要的参考信息。然而，获取一个城市的人群轨迹数据却非常困难。
在今年4月份召开的国际顶级互联网会议WWW 2020（CCF-A类）上，京东城市报告了被会议收录的论文《What is the Human Mobility in a New City: Transfer Mobility Knowledge Across Cities》，研究了如何通过迁移学习，根据一个城市的POI、路网、交通信息来推测它的人群轨迹分布。
文章插图
1. 背景城市人群出行所产生的轨迹信息是公共交通规划、城市基础建设、商业选址智能系统的重要参考数据。但由于隐私、商业保密和传感器部署预算等原因，想要得到城市大量的轨迹是非常困难的，尤其是对于一个新的、缺乏数据采集的城市区域。
文章插图
图 1
然而我们知道，一个城市的出行轨迹分布，与该城市的POI、公交、路网信息存在关联。那么，是否可以通过已有轨迹的城市区域，去学习这种关联，并将这种关联应用在目标城市上呢？这正是该工作所作的研究。正如图1示例，通过对已有轨迹的城市如北京、合肥进行出行知识建模，通过雄安的路网、POI、公交信息，得到雄安的轨迹数据分布。
文章插图
图 2
作者将出行的本质归为三个阶段（图2）：1）产生出行意图、选择目的地和路线选择。顺着这个思路，该论文将新城市的轨迹生成问题拆分成三步：1）出行意图迁移；2）起始点-终点（OD）生成；3）路线生成。
2. 出行意图生成由于不同城市的建设程度、规划风格存在差异，从源城市中显式学习到的出行规律，无法很好应用于目标城市。一个典型例子是，北京有大量从家到地铁站的短途出行需求，而小城市没有地铁站，就不存在家-地铁的出行模式。这就是各城市在显式特征空间中的分布不一致现象（图3左）。
文章插图
图 3
虽然显式出行模式不能直接应用在新的城市，但作者尝试找到一个隐空间，在这个空间里，各个城市的数据分布相近，通过源城市学习得到这个一致分布，并将其作为目标城市的分布（图3右）——这就是迁移学习领域的域泛化（Domain Generalization）思想。
文章插图
图 4
图4展示了出行意图生成模块的具体过程。
首先，根据两个源城市轨迹的起始点终点，提取显式的特征——空间信息特征(Spatial Context Features) 。提取包括了POI分布、起终点在路网中的拓扑特征、与公交站的距离等信息（图4b）。
接下来，基于域泛化思想，从不同源城市OD点的空间信息特征中学习泛化函数G ，最小化G函数映射后源城市之间的分布最大平均差异。如图4c所示，通过学得的G映射函数，在G目标空间——出行意图空间(Mobility Intention Space)中，不同源城市的分布相近。
最后，对出行意图空间中的数据进行建模，对出行意图分布建立生成模型（图4d）。根据作者在早期探查中的试验，从源城市得到的出行意图分布，与目标城市的出行意图分布也很接近。因此，该工作将源城市的出行意图分布直接作为目标城市的出行意图分布。
3. 目标城市的起终点生成通过上一步，我们得到了出行意图空间的生成模型，产生目标城市的出行意图数据。但出行意图数据是隐空间数据，如何通过产生的出行意图向量，来算得目标城市真实的起终点？