拉框、涂色、分类、再标注……今年32岁的刘虹玉下岗后再就业成为了一名人工智能训练师。记者联系到她时,她正在给一段视频里来来往往的车辆打上“标签”,只见她把一辆越野车车身用蓝色矩形框圈起来,选定车型类别标签,就可以提交给数据库,让AI进行简单鉴别和分类学习。刘虹玉所做的人工智能训练师工作,简单地说,就是为大量平台数据标注和分析,导入算法模型后进行训练,教会人工智能更精准识别用户意图。人工智能训练师到底是个什么样的工作?与数据标注师有什么区别?目前行业需要什么样的人才?记者进行了探访。
给人工智能当“启蒙老师”
(资料图片)
“这朵花真漂亮啊!”这句人类看来非常简单的话,对于机器来说却可能搞不清楚到底怎么回答。让人工智能越来越像人类,是目前人工智能系统正在发力的方向。伴随着人工智能在生活场景中的渗透,人工智能“劳动力”已经走进各行各业。然而,一些不成熟的人工智能系统给人们带来了糟糕的体验,例如在网购平台联系客服沟通问题,聊了半天却发现是人工智能客服,并且回答文不对题,完全不能满足用户需求。为了让人工智能更像“人”,更智能,就需要人工智能训练师帮助AI进行“学习”。
人工智能训练师,简单地说,就是人工智能成长的“数据饲养员”。根据国家职业技能标准,人工智能训练师是随着人工智能技术的广泛应用产生的新兴职业,是指使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员。
人工智能训练师要担负起哪些职责?资深人工智能训练师徐亦涛告诉记者,人工智能训练师入门级的工作,是提供数据标注规则。所谓数据标注,就是把经过加工处理后的数据添加进训练数据集,这也就是目前最常见到的数据标注工作。以数据验收与数据管理为例,人工智能行业在各细分的领域或开源数据中能够积累的大量原始数据,但这些数据往往缺乏可复用性,无法得到有效分类整理。人工智能训练师便需要参与模型搭建和数据验收,并负责核心指标和数据的日常跟踪维护,进而大大提高数据利用的效率。
“我们通过算法聚类、标注分析等方式,从数据中提取行业特征场景,为人工智能提供表达精准、逻辑清晰的数据标注规则,确保数据训练效果满足产品需求。同时,人工智能训练师还需要一定的数据沉淀与数据挖掘能力。根据细分领域的数据应用要求,从已有数据中挑选符合要求的通用数据,让人工智能利用数据自主学习分析,让AI学会‘思考’。”徐亦涛说。
人工智能训练师缺口较大,但绝不等同于数据标注师
在家带娃也能工作、轻轻松松月入上万、操作简单好上手……在一些招聘平台,记者发现一些打着“人工智能训练师”旗号的岗位在卖力吆喝,声称零技术基础也能快速上手工作。这些信息可靠吗?人工智能训练师到底需要什么样的人才?记者进行了探访。
记者联系到江苏一家正在招聘人工智能训练师的公司,该公司人力资源专员王女士透露,目前正在招聘的是电商客服类人工智能训练师,要求有本科及以上学历,拥有一定计算机基础,以及文字阅读理解能力,工作内容为对文本、图像、语音等数据进行采集和标注。其中语音标注任务包括语音数据库的录音文本整理、拼写、校对、音频截取各环节,负责数据质量验收,图像标注任务包括语义分割、2D标注、3D标注,文本标注任务为情感分析、意图分析、文本打标、相似问、智慧问答等。
“我们在构建一套智能语音质检系统,利用NLP技术对用户对话文本进行分析挖掘,实现机器自动质检,提高客户服务质量。”王女士介绍,比如与用户沟通时用户表示“不需要”的次数越多,这个用户的拒绝率就越大,“因此我们构建了这样一个模型来预测被拒概率,将表示拒绝产品推销的用户放入单独的沉寂库,降低对客户的推销频率。”
业内专家表示,大数据挖掘的背后需要大量人工操作,例如进行数据清洗标注,这些属于人工智能训练师的基础工作。江苏一家科技企业人力资源负责人郑兴介绍,他们正在招聘人工智能训练师数据标注员,要求应聘者拥有大专及以上学历,主要负责自动驾驶汽车相关项目的数据标注和管理工作,包括图像、视频、点云等2D/3D数据的标注,后期可以负责数据团队的管理和团队建设。
“目前,我们对基础人工智能训练师的需求还是比较大的,尤其是在企业成长初期,需要大量人力劳动介入。”郑兴告诉记者,人工智能训练师不仅要对AI模型进行训练和迭代,还要对收集到的数据进行筛选和清洗,并用于AI模型训练,并持续跟踪AI模型运行状况,及时迭代纠正。
当然,更优质的人机交互体验,才是人工智能的进步的目的。徐亦涛介绍,高级人工智能训练师的工作并不容易,他们对技术的掌握需要上升到产品应用的问题,将模型落地到具体的场景中。他们需要能够根据复杂业务场景和跨业务单元场景的深入理解,搭建业务分析框架,结合人工智能技术为所负责的业务线提出具有前瞻性的业务发展规划建议,并能够对现有业务流程重构,在业务流程中发现创新点,整合推动技术的创新。
“总之,人工智能训练师绝不能简单等同于数据标注师,在人才金字塔架构中,精通AI底层逻辑技术,熟练运用AI技术‘进化’人工智能的高端人工智能训练师,才是未来最需要的人才。”徐亦涛说。
让人工智能越来越“聪明”
随着人工智能在智能制造、智能交通、智慧城市、智能医疗、智能农业、智能物流、智能金融及其他各行各业的广泛应用,业内专家预测,人工智能训练师的规模将迎来爆发式增长。
去年12月,江苏省发布了一批省高技能人才培训补贴紧缺型职业(工种)目录,共收录职业(工种)40个,其中就有人工智能训练师的身影。目录发布后,各地可结合当地产业实际和企业需要,从中选取相应职业(工种)纳入本地高技能人才培训补贴紧缺型职业(工种)目录。一线劳动者参加紧缺目录内的职业(工种)培训并取得相应证书的,补贴标准较目录以外同类职业(工种)可上浮30%,根据不同职业和等级可以申领2000-6000元的培训补贴。
目前,人工智能训练师还存在着高端技能人才不足的情况,且青年人才供给力度较弱。日前,全国513所高职院校成功备案人工智能技术应用专业,其中江苏有34所高职院校获得备案。部分院校已经开设人工智能训练师相关课程,以人工智能技术与应用为核心,涵盖Python、机器学习、计算机视觉、自然语言处理等专业内容,理论实操结合,增强学生人工智能技术的应用能力。
业内专家透露,大部分人工智能初创公司正逐渐完成产品验证,所服务的领域越来越广泛,构建人工智能数据的行业壁垒成为必不可少的一环。未来,人工智能将在触手可及的体验端帮助各领域企业突破服务交互极限,高效满足用户需求。
“目前,人工智能在对人类语义理解上还存在一定偏差,让人工智能完全替代人类工作还不能实现,但一些基础性判断和沟通,人工智能已经可以胜任,我们需要在人工智能训练师的帮助下,让人工智能越来越‘聪明’。”徐亦涛说。
新华日报·交汇点记者 程晓琳
图源视觉中国
关键词: