[IT时代网]AI场景化落地的背后力量,“饲养员”人工智能训练师

_本文原题为:“饲养员”人工智能训练师 , AI场景化落地的背后力量来源:网络
【[IT时代网]AI场景化落地的背后力量,“饲养员”人工智能训练师】导语:随着人工智能技术的日趋成熟 , 只存在电影中的人工智能早已闯入了现实生活 。
24岁的刘雪(化名)从未见过自动驾驶汽车 , 但作为一名人工智能训练师 , 她的工作却和人工智能重要领域之一的自动驾驶息息相关 。
[IT时代网]AI场景化落地的背后力量,“饲养员”人工智能训练师
文章图片
坐落于北京市房山区的互联网金融安全示范产业园里就有一个大型的数据标注基地 , 刘雪和其他的人工智能训练师就在这里办公 。 他们的工作需要在电脑前进行图片、文本或者声音的标注 。 比如通过数据标注工具 , 放大图片 , 将一辆巴士用矩形框圈出 , 并给这个框打上“巴士”的标签 , 然后继续在图像上标记其他车辆、行人及自行车等等物体 , 这些打好标签的数据 , 将会成为人工智能算法训练的学习材料 , 是教会算法识别物体的重要资料 。
Testin云测旗下的云测数据 , 通过自建数据标注基地和数据采集场景实验室为人工智能提供数据采集和标注服务 。 云测数据是业内为数不多的有能力控制整个生产流程的数据资源服务商 , 有媒体将其和商汤、旷视、涂鸦智能、地平线这些在算法、算力、数据不同领域的深耕企业称之为“人工智能五强” 。 刘雪作为云测数据专业数据全职人员其中之一 , 和其他人工智能训练师为智能驾驶、智慧城市、智能家居、智慧金融、新零售等行业进行高质量的数据采集标注 , 最终转化为产业智能化的数据动力 。
众所周知的是 , 人工智能由算法、算力、数据三大要素构成 。 其中 , 算法需要被大量精准的数据训练 , 如同儿童需要不断的正确学习 , 才能认知世界 。 AI也是如此 , 算法依据大量高质的数据总结规律 , 从而形成自己的认知模式 。 机器并不能理解原始数据 , 这些原始数据需要人为的“标签化” , 这些标注好的数据越精准 , 算法就会越成熟 。 现阶段人工智能之所以“智能” , 人工智能训练师发挥的作用可谓重中之重 。
人工智能训练师纳入现代职业体系
近日 , 人社部与市场监管总局、国家统计局联合向社会发布了人工智能训练师、智能制造工程技术人员等16个新职业 。
人社厅的官方公示对人工智能训练师的主要工作任务做了详细介绍 , 第一条就是“标注和加工图片、文字、语音等业务的原始数据” , 并注明“人工智能训练师包含但不限于数据标注员、人工智能算法测试员”这两种工种 。
人工智能训练师作为AI技术紧密相关的重要职业 , 引起了社会各界的广泛关注 。
[IT时代网]AI场景化落地的背后力量,“饲养员”人工智能训练师
文章图片
人工智能正在成为数字经济的核心驱动力 。 作为国家“新型基础设施建设”之一的重要力量 , AI已经运用在智慧城市、交通、家居、医疗、金融和教育等各个领域 。 AI数据领域头部企业云测数据认为 , AI各领域都需要贴合场景的高质量数据来完成算法训练 , 来达成最终的AI应用落地 。
以上文提到的智能驾驶举例,智能驾驶多应用于自动驾驶、自主泊车、智能驾舱等场景,云测数据为其提供多维度、多模态的数据支撑 , 为车内车外的场景数据提供连续帧标注、2D图像框选、图像分割、3D点云标注、2D3D融合标注等众多数据服务 。
在智能家居领域中 , 云测数据依托于丰富项目经验与优秀的行业理解,为智能家电、智能音箱、智能扫地机器人等场景提供全类型的数据标注数据采集服务 。 如语义分割、ASR语音转写,唤醒词/控制词、方言语料采集等等服务 。
这其中,又涉及到AI技术中重要分支的自然语言处理(NLP),具体的商业化应用有:机器翻译、舆情监测、自动摘要、问答机器人、客服机器人、智能问诊等,云测数据为以上众多领域提供高质量的NLP数据支撑 。 在云测数据,以智能客服单个场景的意图标注,就分为10-20个大类,上百个子类,根据业务需求可能还会有进一步的标注细分 。 同时,云测数据除了对NLP数据进行对话意图、领域、槽位等进行判断和标注,还可以进行多角度的泛化 。