欢迎来到青岛日报社(集团)数字报纸
A06:今日看点
~~~记者走近岛城人工智能(AI)训练师 倾听他们在海量图像数据标注工作中的日常
用“数据标注”护航无人驾驶
记者走近岛城人工智能(AI)训练师 倾听他们在海量图像数据标注工作中的日常
  人工智能(AI)训练师柴华正在进行数据标注工作。

  扫码观看相关视频

  近年来,人力资源和社会保障部等三部门陆续向社会发布了一批与新质生产力密切相关的新职业,其中,与智能制造、人工智能等行业相关的数字职业占比较多,例如智能网联汽车测试员、生成式人工智能系统应用员、智能制造系统运维员等,人工智能(AI)训练师也在此列。

  当下,随着人工智能技术和应用的不断发展,数据标注和训练变得越来越重要,而人工智能(AI)训练师这一职业便是专门从事数据标注和训练的专业人员。8月21日,青岛早报记者来到位于西海岸新区珠江路556号的青岛科路培优教育科技有限公司(以下简称“科路标注”),探访人工智能(AI)训练师数据标注员是如何通过数据训练护航无人驾驶的。

  为AI提供训练“教材”

  如今,“遇事不决问AI(人工智能)”正成为越来越多人的习惯,在汽车领域,基于人工智能研发的无人驾驶、自动驾驶等前沿技术也日渐成熟。事实上,AI(人工智能)并非天生就这么全能,它的这些本领,均是来自人工智能训练师的“教导”——通过数据采集、标注,并且反复进行训练和测试。最终,AI(人工智能)才能从啥也不懂的“小白”,成长为上知天文下知地理的“全面手”。

  今年32岁的叶紫茗是烟台人,大学毕业以后选择在青岛工作定居,目前是科路标注青岛总部团队标注二组的组长。2022年年底开始从事人工智能(AI)训练师职业的她,仅用了不到两年时间便成为了一个16人数据标注团队的负责人。

  记者了解到,人工智能(AI)训练师是指使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的专业人员,包含数据标注员、人工智能算法测试员两个工种,共设五个等级。其中,五级/初级工、四级/中级工是数据标注员的级别,三级/高级工、二级/技师、一级/高级技师是人工智能算法测试员的级别。

  叶紫茗告诉记者,科路标注青岛总部团队的成员主要是人工智能(AI)训练师中的数据标注员,“我们日常的工作内容主要是给无人驾驶的汽车做底层的道路数据标注,具体就是根据客户提供的图像材料,把道路上的实线、虚线、行人、轿车等所需要的元素标注出来,便于AI理解和接受训练测试。”

  在叶紫茗的电脑操作界面上,记者看到,一张道路图像上分布着汽车、行人以及路边的栅栏等元素,叶紫茗正操作鼠标,对图像进行局部的放大和缩小,并点击鼠标拉动出一个又一个的矩形框,通过“拉框”将这些元素逐个标注出来。

  AI的核心是算法,可以理解为AI的大脑。大脑懂得越多、转得越快,AI的能力就越强。叶紫茗说:“以自动驾驶为例,AI需要在模拟驾驶的场景中进行学习和训练,不断测试完善功能,而我们所做的数据标注工作,就像是为AI提供了‘教材’,将道路场景图像中的障碍元素标注出来,让AI能够更加方便地学习和理解。”

  叶紫茗和同事们把日常的道路数据标注工作称为“做题”,一张图像就是一道题。这些“题目”可以分为2D、3D和4D。在“做题”时,2D的题目只需要用平面的矩形框将元素标注出来即可,而3D和4D的题目则需要运用矩形的长方体框进行元素的标注。“道路数据标注的工作并不难,但需要数据标注员坐得住,细心、有耐心。”叶紫茗告诉记者,团队成员们按图像的张数记工作量,元素相对简单的图像,每人每天可完成2—3张,元素比较多的图像,每人2—3天可以完成一张,她所负责的小组有16人,每月可完成数千张图像的数据标注工作。

  行业发展前景广阔

  与叶紫茗类似,今年23岁的柴华是辽宁沈阳人,大学毕业后也选择留在青岛,并加入了科路标注青岛总部团队,成为了标注一组的数据标注员。从2023年10月入行至今,经过近一年的历练,柴华已经成为一名数据标注的“熟手”。

  柴华告诉记者,作为一名00后,她在上学时就对人工智能相关的新兴业态很感兴趣,毕业后了解到人工智能(AI)数据标注这一行业,便毅然选择了成为一名人工智能(AI)训练师。如今,柴华主要从事道路图像中“车道线”这一元素的数据标注工作,需要每天对道路图像上的数百条实线、虚线进行准确的标注。

  “现在我每天可以完成10多张图像的数据标注,工作量适中,薪资收入整体符合我的预期,未来也有比较好的个人发展和成长空间,我打算在这个行业长期发展下去。”柴华说道。

  在成为一名人工智能(AI)训练师之前,叶紫茗曾在一家食品公司从事文秘工作。一次偶然的机会,她了解到人工智能(AI)行业发展前景好,人才需求也比较旺盛,并接触到了人工智能(AI)训练师这一职业概念,于是就决定转行,加入了科路标注的青岛总部团队。“我非常看好人工智能行业的发展前景。”叶紫茗告诉记者,虽然已经成为了团队的负责人,但她还想继续努力,在培养新人的同时,继续向上寻求更多的历练机会,在这个行业不断深耕下去。

  打造AI训练人才培育模式

  张峻彬是青岛科路培优教育科技有限公司的总经理。2021年,他投身人工智能(AI)数据标注行业,创立了现在的公司,并逐步组建起科路标注青岛总部团队。“2014年至今,我一直从事的是驾培行业,但对互联网和人工智能行业很感兴趣。”张峻彬告诉记者,2015年—2019年,他开始涉足互联网行业,并在创业过程中接触到了数据标注这一领域。

  张峻彬介绍,在过去,人工智能(AI)公司从用户那里获取到的原始数据无法直接用于模型训练,是由人工智能(AI)产品经理先用相关工具简单处理,再交给数据标注人员进行标注加工,但因为标注人员对数据的理解和标注质量差异很大,导致整体标注工作的效率和效果都不够理想。同时,人工智能(AI)公司在其细分领域内积累了大量数据,这些数据往往在使用一次后就不再产生更多价值,随之带来了第二个问题,数据无法沉淀和复用。基于这两个问题,人工智能(AI)训练师这一职业应运而生。

  “我们科路标注是一家人工智能领域的基础数据服务公司,在智能自动驾驶和高级汽车辅助驾驶领域拥有专业的数据标注及训练技术。”张峻彬告诉记者,公司致力于聚焦人工智能通用基础设施的构建,打通感知与认知智能的边界,推动人工智能在更多垂直场景实现落地应用。目前,公司已经在青岛、日照、德州、泰安四市组建起超200人的数据标注团队,累计为10余家车企提供规范化的道路数据处理、标注、训练、验收、交付服务。

  “我们从2021年开始进入这个行业,2023年开始迎来快速扩张阶段,标注数据量每年保持10%左右的增长,数据标注团队的人数每年翻一番。”张峻彬表示,下一步,科路标注计划与当地政府洽谈共建基础数据标注基地,将数据标注团队逐步扩大至500人左右,同时申办人工智能(AI)训练师的职业资格认定培训机构,打造“培训+就业”的人工智能(AI)训练人才培育模式,助推人工智能(AI)行业规范有序发展。

  本版撰稿摄影 观海新闻/青岛早报记者 郭念礼

  名词解释

  人工智能(AI)训练师

  人工智能(AI)训练师是指使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的专业人员。

  人工智能(AI)训练师包含数据标注员、人工智能算法测试员两个工种,共设五个等级。其中,五级/初级工、四级/中级工是数据标注员的级别,三级/高级工、二级/技师、一级/高级技师是人工智能算法测试员的级别。

3 上一篇   下一篇 4  
放大 缩小 默认
主办单位:青岛日报社
Copyright © right 青岛日报 All Rights Reserved. 未经许可不得复制
   第A01版:头版
   第A02版:大爱青岛
   第A03版:大爱青岛
   第A04版:大爱青岛
   第A05版:发布
   第A06版:今日看点
   第A07版:今日看点
   第A08版:一线探访
   第A09版:深读
   第A10版:周末
   第A11版:文艺评论
   第A12版:视角
用“数据标注”护航无人驾驶
青岛早报今日看点A06用“数据标注”护航无人驾驶 2024-08-24 2 2024年08月24日 星期六