一旦应用标签,您的汽车将能够在几秒钟内理解
“数据标注”业务的项目经理黄雨辰正在做这个项目。编者按:当流水线工人变成人工智能培训师,车间轰鸣变成数据流,产业链蓬勃发展的湖北省将给出“人将去向何方”的精彩答案。随着每个行业的迭代和颠覆,工作都植根于新的轨迹和新的场景。敬请关注本报“行业就业增长”专栏。文/图 湖北日报全媒体记者刘天宗眺望城市风光。人类一眼就能看到“车、人、红绿灯、建筑物、道路”。 AI看到的是一堆0到255像素的矩阵。对人工智能来说,标记数据意味着“翻译世界”。数据注释器的出现是为了响应时代的需求。蓝亿(武汉)智能数据服务有限公司,位于武汉科技大学科技园,拥有一支由多名技术人员组成的团队。汉族数据标注员500人,分布在省内外多个城市,平均年龄不到30岁。恩施市27岁的女孩范玉成就是其中之一。她于2020年加入蓝一智能,如今已经从一名普通的“数据记录员”转型为“项目经理”。令人惊讶的是,他大学的专业是汉语言文学。在数据、代码和算法无处不在的人工智能领域,文科学生确实被推到了中心位置。对于初学者来说,上手并不是那么困难。他留着及肩的短发,戴着黑框眼镜,穿着休闲T恤,一台平板电脑,还有几本书。当我第一次在蓝一智能门口看到黄雨辰的时候,我还以为她是一个独自去图书馆的大学生。当您打开办公室计算机时,您会看到引人注目的图像,这些图像形成了一系列“网络”风格的城市街景:连接点的图表、彩色注释框和内部信息。r锁定标记线。 “这就是数据标注。它可以有多种类型,包括文本、图像、视频和音频。通过对数据进行标记、描述和添加注释,轻松学习和理解大规模人工智能模型。”范玉成解释道。 AI产业的三要素是数据、算力、算法。其中,数据是人工智能的“营养源”,算力是人工智能的“筋力”,算法是人工智能的“思维”。数据注释正在为人工智能创建“切片”,将原始数据处理成可以被机器学习节奏识别的内容。例如,查看城市街道需要人类使用专门的软件来标记汽车、行人、道路、红绿灯、建筑物、绿地、车道等各种元素。要训练大型AI模型的“眼力”和“脑力”,开始注释数据容易吗? “如果你学习能力强、有耐心、注重细节、电脑熟练,那没那么难黄雨辰透露,2020年大学毕业时,湖北省的数据标注行业刚刚兴起,专业人才严重短缺,他决定尝试一下,并将简历发给了蓝一信息。所有入门任务都是初级水平,比如用行车记录仪给照片打标签。对于黄雨辰来说,这类似于使用专业的“P图”软件,对女孩子们来说,是她们擅长的事情。行人总数,每张照片中的车辆、道路等元素大约有60个“注释框”,黄雨辰每天可以处理50到60张照片,对基于AI的成分数据的需求正在增加。如果每天要编辑数十甚至数百张照片,你必然会感到无聊。“与在照相馆制作的复杂照片相比,带有注释数据的图像的准确性要高得多。”职业专家黄宇辰说。他说,第一年,他主要处理二维图像或车载摄像头拍摄的照片数据。每张照片打分后,公司都有专门的质检员来验证注释的质量,误差不能超过1个像素。例如,在24英寸显示器上,如果将分辨率设置为1920(宽)x 1080(高度),每个像素宽度小于0.3毫米,相当于将图像数据的标注误差精确地“裁剪”成“万花筒”形状,黄宇辰表示,数据标注者的日常工作是“以数值为基础”进行评估的,而那些效率慢的人则可以得到更多的结果。标注速度快、质量差只能花费更多的时间和精力来弥补其缺点。另外,汽车企业的订单很多都与新车的研发、生产进度相关,数据标注员每天必须按节点、不耽误地完成工作,因此数据标注员熬夜加班是常有的事。由于出色的表现,黄雨辰从一名数据标注员、团队负责人、项目主管,成长为一名项目经理,为蓝亿智能协调培训、客户对接、生产进度以及多个项目的交付。其项目涵盖汽车、工业制造、智能安防、新零售、医疗健康、金融等行业。 “大规模的人工智能模型大约每三到四个月就会迭代一次。市场对数据标注的需求越来越大,标注的内容也越来越复杂。”范玉成说。武田以自主驾驶为例。早年的职业生涯中,黄宇辰主要利用车载摄像头拍摄的二维图像数据以及图像中车辆、行人、交通标志等的帧。由于2D图像数据无法识别距离和空间,激光雷达和毫米波雷达生成的3D点云数据的标注正在迅速发展。然而,驾驶自动驾驶汽车时,周围环境是动态的,3D点云数据仅提供静态的空间场景。因此,2024年,包含时间序列信息的四维标注将开始出现,能够更全面地描述物体的运动轨迹、形态变化以及物体与环境的相互作用。如今,从蔚来、理想、吉利、东风、长安等车企对蓝一智能的订单来看,4D点云数据标注已经很普遍。 “这“表明我国自动驾驶技术正在快速发展,对AI获取‘饲料’数据的要求越来越高。”范玉成表示。人工智能有助于消除“心理内耗”。黄玉辰将人工智能产业分为“人工智能+智能”。日益智能化的大型AI模型的背后,是无数数据标注者夜以继日的默默奉献。蓝一智能创始人兼CEO张雪娇是一位“90后”。他见证了黄雨辰和其他数据标注者的奋斗和成长。张雪娇透露,近年来,我国每年新增数百家数据标注公司。 “如果一家公司想要在智力密集型行业中生存,就必须拥有独特的‘技术技能’。”TechnicalMoat”。张雪娇介绍,蓝一智能凭借武汉理工大学在汽车行业的实力,自主研发了“LINE”数据标签可以解决大部分车企的数据标注需求问题,实现“采集、清洗、脱敏、标注、质检、培训”的全面数据处理。 LINE平台旨在提高数据标注的效率和质量,减轻企业负担。以数据标注器为例,每个点云图像包含100到500帧。每个框架必须标记至少数百个点、线和框。 Line平台自动完成70%以上的预标注任务,支持多人、团队协作标注,并提供内联功能,为数据记录者提供智能质检工具。张雪娇认为,处理器越细致、专业,数据集的质量就越高,医疗健康、嵌入式智能等产业成为湖北新的增长点。成立五年来值得庆幸的是,蓝一智能与所属高校合作开展技能培训,培养数万名数据标注人才,真正实现行业就业“激增”。 上一篇:省委常委委员要学习宣传贯彻中共中央第四次代
下一篇:没有了
下一篇:没有了





