消息资讯|百度CTO王海峰:语言与知识技术是人工智能认知能力的核心

_原题为 百度CTO王海峰:语言与知识技术是人工智能认知能力的核心

消息资讯|百度CTO王海峰:语言与知识技术是人工智能认知能力的核心
文章图片
8月25日午间消息 , 在百度大脑语言与知识技术峰会上 , 百度CTO王海峰表示 , “在百度语言与知识技术的布局和发展中 , 我们始终在注意把握两个趋势 , 即技术发展趋势和产业发展趋势 , 并力争引领趋势 。 ” 王海峰回顾百度语言与知识技术发展历程时表示 , 语言与知识技术是人工智能认知能力的核心 。
2010年 , 百度成立自然语言处理部 , 历经近十年发展 , 百度已经构建了完整的语言与知识技术布局 , 包括知识图谱、语言理解与生成技术 , 以及上述技术所支持的包含智能搜索、机器翻译、对话系统、智能写作、深度问答等在内的的应用系统 。会上 , 百度发布了语义理解技术与平台文心、智能文档分析平台TextMind和AI同传会议解决方案3大新产品 , 同时发布了6项升级 , 包括智能创作平台的3个场景方案、以及智能对话定制与服务平台UNIT的3项升级 。其中 , 语义理解技术与平台文心基于深度学习平台飞桨打造 , 依托领先的语义理解核心技术 , 集成优秀的预训练模型、全面的NLP算法集、端到端开发套件和平台 , 提供一站式NLP开发与服务 。智能文档分析平台TextMind , 基于OCR、NLP技术 , 以文档解析为核心能力 , 支持文档对比与文档审核 , 具备“多快好省”的核心优势 。百度大脑智能创作平台针对媒体应用场景再升级 , 全新推出智能策划、智能采编、智能审校三大媒体场景方案;智能对话定制与服务平台UNIT升级3大特性:更智能的任务式对话理解、极致便捷的表格问答和融合通用的新对话引擎 。此外 , 为突破数据匮乏、算力不足等历年来语言与知识技术研发中面临的瓶颈 , 百度联合中国计算机学会、中国中文信息学会发起中文自然语言处理数据共建计划——千言 , 解决数据稀缺问题 。

消息资讯|百度CTO王海峰:语言与知识技术是人工智能认知能力的核心
文章图片
【消息资讯|百度CTO王海峰:语言与知识技术是人工智能认知能力的核心】千言一期由来自国内11家高校和企业的数据资源研发者共同建设 , 已涵盖开放域对话、阅读理解等7大任务 , 20余个中文开源数据集 。百度技术委员会主席吴华表示 , “未来 , 我们希望有更多的数据集作者能够参与共建千言 , 共同推动中文信息处理技术的进步 , 建设世界范围的中文信息处理影响力 。 我们计划在未来3年 , 面向20多个任务 , 收集和建设不少于100个中文自然语言处理数据集 , 覆盖语言与知识技术全部领域 。 ” 最后 , 王海峰对语言与知识技术的进一步发展做了展望 。 他表示 , 复杂知识表示和快速构建技术 , 知识与深度学习进一步融合 , 深度融合感知和认知的跨模态语义理解技术 , 模型可解释性和鲁棒性等等 , 仍有很多技术难题需要持续研究和解决 。