IT168“共享智能”技术,AI华人科学家张本宇解密蚂蚁

网上搜索“张本宇” , 你可以找到无数高大上的标签 , AI华人科学家中排名前十的大牛;曾就职谷歌、Facebook , 后创立云脑科技;深耕人工智能领域20年 , 手握154项美国专利 , 在国际一流期刊及会议上发表的45篇论文已被引用超过1万次 。
IT168“共享智能”技术,AI华人科学家张本宇解密蚂蚁
文章图片
蚂蚁金服共享智能实验室首席科学家张本宇
甚至还有一张西装革履 , 交叉握手于胸前 , 面朝镜头露出标准职业笑容的封面硬照 。 撕去标签 , 离开网络 , 真实世界里的张本宇 , 穿着随意 , 就像身边普通的程序员 , 看上去远比78年出生的实际年龄小 。
从1999年他在北大攻读人工智能硕士算起 , 正式踏上AI的征程 。 20年过去了 , 荣辱沉浮 , 恩怨俱散 , 他仍是最初那个追着数据跑的少年 。
AI老兵的新战场
我试图让张本宇描述下入职蚂蚁金服后的高光时刻 。 他回忆一会 , 很遗憾地告诉我 , 没有什么高光时刻 , 但有一幕深深印在他脑海里 。
【IT168“共享智能”技术,AI华人科学家张本宇解密蚂蚁】那是去年12月18日 , 圣诞节前一周 , 他从硅谷的家中出发 , 坐11小时飞机 , 抵达上海后换机场高速前往杭州 , 汽车驶进西溪路556号 , 一幢极具现代化气息的“之”字形建筑赫然出现 , 门口立着五个大字“蚂蚁Z空间” 。
很快 , 张本宇出现在一间名为“恒长钱庄”的办公室 , 和20余名同事一起等待CTO宣布共享智能事业部成立 。
他回忆起上一次来杭州 , 专程来跟管理层对接“共享智能”的相关事项 , 却赶上上海雷暴 , 飞机迫降在韩国 , “好事多磨”那是他惊魂未定时跳出的第一反应 。
如今 , 他和20多张年轻朝气的脸庞在镜头前微笑合影 , 用仪式记录事业部成立 , 他又想到四个字“新的起点” 。
这些新同事都是二三十岁的年轻人 , 他们来自人工智能、大数据、数据技术等不同部门 , Base在杭州、北京、上海的都有 。 他们的集合就像一次全科手术 , 汇聚方方面面的专家 , 给心肌梗塞的病人开刀 , 病因是数据不畅造成的血栓 , “共享智能”则成了手术刀 。
什么是共享智能?对于这个问题 , 张本宇显得非常兴奋 。 他告诉笔者 , 共享智能是一门新兴的交叉学科 , 近些年获得了学术界与工业界的广泛关注 。
当前 , 数据是极其重要的生产要素 , 也是各类大数据应用的基础 , 数据的质量和数量也已经成为影响人工智能模型效果最重要的因素之一 。 随着AI模型能力和算力的提升 , 各种应用场景对各种异构、异源数据的使用效率也在飞速提升 。 然而 , 数据的广泛使用在提升应用效果的同时也引发了公众对于数据安全性的担忧 。 这主要是归结于数据自身的两个很重要的特性:一个是可复制性 , 一个是可复用性 。 可复制是指 , 数据可以被完整的、极低成本的拷贝;可复用性是指 , 某份数据可以被多个不同领域的场景复用 , 也可以在相对长的一个时间轴上被复用 。
所以如果不同应用之间直接共享数据 , 那么可复制性和可复用性 , 一定会导致数据泄露的情况 , 也就是被留存二次使用 , 从而侵犯了商业利益 。 更为严重的是 , 如果是个人相关的数据 , 很多时候 , 数据的管理者和使用者并不是数据的所有者 。 一旦在数据共享的过程中 , 发生了数据泄露 , 被对方滥用 , 那数据的管理者不仅仅是商业利益受到侵犯 , 它很可能也没有尽到数据管理的责任 。 从欧盟的GDPR开始 , 到美国CCPA , 再到中国的数据安全法、网络安全法、个人信息保护法都对这种数据管理失责和数据滥用 , 都有着严格的规范 。 所以各大数据方 , 出于保护商业利益、法律风险、舆论风险各方面考虑 , 都在收紧数据共享 , 从而形成了大数据孤岛 。
为了便于进一步理解 , 张本宇举了个例子:有A , B , C三家企业 , 这三家企业各有利润 , 都不想被披露出来 。 当行业协会找到他们 , 想要通过他们的数据计算出行业的平均利润 , 以进一步指导行业发展 。