您的位置:首页 > 科技 > 名人名企 > 数据标注产业会成为下一个富士康吗?

数据标注产业会成为下一个富士康吗?

2019-10-24 来源:飞象网  浏览:    关键词:人工智能,大数据,富士康

“我很快乐我所从事的行业正在疾速成为中国的一个繁荣产业。”95后大学生小谭对第一财经记者表示,小谭刚毕业一年,于今年年初参与了一家海外数据标注公司,该公司今年刚宣布进入中国市场。

随着大型科技公司、银行和其他机构尝试应用人工智能来改善其产品和效劳,中国对数据标注的需求正在呈现迸发式的增长。

放下农耕工具投入AI树立

人工智能展开带动了数据标注行业的兴起,特别在自动驾驶范畴,其普遍运用的AI深度学习算法,需求大量锻炼样本中止不时的算法优化,这些锻炼样本就是被标注过的原始数据。

数据标注行业曾经开端为中国一些偏僻城市和乡村的劳动力发明新的就业机遇,他们放下农耕工具,开端投入AI展开的浪潮中。

小谭通知记者,她的一些同事是从偏僻的乡村地域特地来到无锡上班的。“我们会在网上发布一些招聘信息,从其他中央赶来面试的人还是很多的。”她说,“能够接触更多的信息和技术对我们的改动还是很大的。”

往常,她和同事每天都和海量的数据打交道,细致工作包括规则的了解、员工的培训和数据的质检等等。“AI成形乃至更完善都是经过我们的操作才能够变得更智能。”

据小谭所说,普通标注员每天要处置600~700条信息,给不同的图像和语音文字中止标注。同时标注员的工作最终要质检人员中止工作审核,以抵达最终客户方的请求。标注员和质检员的结构比例是1:3,也就是一个质检员需求检查3个标注员的工作。

他们所在的这家名为Appen(澳鹏)的澳大利亚数据标注企业曾经在上海开设了分公司,公司还在近期启动无锡的运营中心。

澳鹏(Appen)CEO Mark Brayan通知第一财经记者:“我们看中的是中国庞大的人工智能市场和企业对数据的需求,并且将为中国发明技术型人才的就业机遇。”

澳鹏的标注对象包括语音、文字、图像和视频等范畴,并将标注好的数据统一卖给散布在全球的技术、汽车和电子商务等类型的大型企业。

“无锡在人员、房价等方面有本钱洼地,而且地处中国东部,能掩盖江浙沪区域,早期能与上海总部构成快速的互动,加上无锡的产业结构优势也相当明显,比如制造业和传统IT等。”澳鹏全球高级副总裁、中国总经理田小鹏通知第一财经记者。

明年年底,无锡中心将扩张至2000人的范围,当然其中相当一部分是众包人员。此外,澳鹏还规划在中国的西南、东北等地树立第二和第三分中心,加大中国的规划力度。

目前,许多数据标注公司依然主要集中在北京和上海等大城市,但技术含量较低的标注业务正在将部分新技术资金分流到较小的城镇,为当地提供农业和制造业之外的就业机遇。

发明大量零工就业岗位

数据标注公司之所以在近两年来兴起,与中国人工智能展开初期所需求的大量的数据密不可分。随着百度和阿里巴巴等中国科技巨头对人工智能的落地应用需求进一步增加,标注自动驾驶汽车拍摄素材的工作也成为数据标注公司很重要的内容之一。

数据标注人员的细致工作是,在屏幕上的每个物体周围插入一个个数码方框,并在下拉菜单上对其标注――车辆、人员、障碍物、动物。假如他们选择“车辆”,则会呈现有更多选项的另一个下拉菜单――小型车、摩托车、卡车和火车等。

由于科技公司所需求的数据量庞大,数据标注公司会把很大一部分标注工作分包进来,这就发明了大量的就业。以澳鹏为例,公司全职员工仅600人,但是全球范围雇用的劳动力总人数抵达了100万。“我们每个月要向50000名众包员工发放工资,发明了很多的零工就业机遇。”Brayan通知第一财经记者。

既推进了AI展开,又促进了就业,数据标注被套上了新时期“富士康”的光环。比如在距离贵阳市中心50公里的百鸟河数字小镇,就有一个范围500人的“数据工场”,500名标注员中,近一半是左近一家扶贫高职的学生。据了解,他们一个月能挣到1500元,经济上足以自立,还能补贴家用,相比餐厅辛劳端盘子或者送外卖这类兼职工作,数据标注相对轻松且面子。

小到用数据爬虫抓取互联网现存数据,并中止拉框,大到依据用户定制化的硬件以及场景需求,去完成数据的采集与多维度数据标注。数据标注行业,往常正朝着专业化、细分化、场景化的方向不时演进。而在这一过程中,一批诸如百度数据众包、云测数据等企业和团队也应运而生。

海外的数据标注市场正在趋向成熟,相似澳鹏这样的企业开端收购中小微数据平台,将自己的议价才干进步到新的水平。

今年3月,澳鹏以高达3亿美圆的价钱收购了另一家数据标注公司Figure Eight。Brayan以为,其技术能够和Figuer Eight互补。不过也有很多业内人士对此表示出了质疑,以为此举是将该范畴带向“垄断”的局面。

与此同时,中国团队曾经开发出一套人工智能的数据标注系统。该软件可将标注的人工工作总量降低,为ADAS及自动驾驶系统开发提供高质量、低本钱的数据支撑。

据引见,为了加快ADAS、智能网联、自动驾驶等相关技术展开进程,清华大学苏州汽车研讨院经过近两年的技术研发与数据考证,于2019年9月胜利推出了国内首个基于大数据自动标注软件的效劳平台,并已与上汽、一汽、陕汽重卡等企业达成协作。

基于深度学习、集成学习、传感器融合等技术,该自动标注软件可依据客户需求提供图片、视频等多种方式的数据采集和标注效劳。软件还集成便当易用的手工修正和标注工具,进一步进步工作效率。

与其配套的标注管理效劳平台能够在线中止任务分发、管理、验收、修正、存档等全工作流程管理,标注人员端和管理人员端能够完成数据库共享与更好的分工协作。

不过,这个行业短时间内仍将属于劳动密集型行业。“我们以为数据标注的很多工作还是要依托人类标注员,由于机器的才干目前可能还达不到所需的精度。我们也留意到机器在数据标注方面的展开潜力,但至少在今天这并不会对我们的业务构成影响。”Brayan说。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:service@qeerd.com,投稿邮箱:tougao@qeerd.com