智能写作人工智能发展的背后

编辑:pitaya02        日期:2020-10-27

人工智能的多少,背后就是人工的多少。

向上是山,向下是煤。曾经为山西传统煤矿工作八年,整天盯着电脑屏幕监测矿井瓦斯浓度的郭梅,从未想到自己的工作会与人工智能有了联系。火龙果智能写作

2年前,由于孩子们来到省会太原上学,郭梅找附近的工作,做了数据标注。又是盯着电脑屏幕,如今,郭梅每天的工作就是将图片、文字或声音标注出来,交给机器训练学习。从头开始,一天只能标注二三百张,到现在每天都要完成1300张,郭梅按件计酬的收入逐渐提高,已经超过了当地平均收入水平。火龙果智能写作

在人工智能产业中有一句话:智能多少,人工多少。和郭梅一样,随着人工智能的发展, AI数据标注师也成为一种新的就业机会。2020年2月,“人工智能培训师”正式成为新的职业并被列入国家职业分类。火龙果智能写作

这就是所谓的人工智能背后的人。为了使 AI能够理解数据,并将其转化为 AI能够消化吸收的“语言”,数据采集和标注是其主要工作。拥有足够且足够好的数据, AI就能像人类一样学习如何更好地为人类服务,从而感知、思考和决策。火龙果智能写作

这工作似乎是单调乏味的,但意义重大。正如汽车没有汽油就无法行驶一样,数据是人工智能发展的燃料。用我们的数据,机器(算法)不断迭代,可以把人工智能推向更好的方向。”山西麟诺公司从事数据标注的总经理李应维告诉第一财经。

数据标注员工工作场景火龙果智能写作

从来没有想过要成为人工智能

二十多岁的李宇龙从来没有亲眼看到过自动驾驶汽车,但他的工作与自动驾驶 AI算法密切相关。

曾在一家生产电子产品的工厂工作过,老板给他打了一个 AI数据标签,第一件事就是“车道上打点”。火龙果智能写作

简而言之,就是用车道线来标记无人驾驶。无人飞行器在行进过程中,会自动连续拍摄一张照片,李宇龙要做的,就是在照片上车辆行驶的车道旁,标出虚线或实线,匹配相应的属性,从而告诉 AI遇到虚线时车辆可以变道,实线不能变道。

那时的李宇龙,还不知道标号的确切含义,更不知道人工智能的具体概念,老板只给了他一套规则,让他根据规则在电脑上认出车道线。善于学习的他很快就掌握了规则和难点,总结出车道标线的规律。火龙果智能写作

当他拿出一个红苹果给机器识别后,又拿出一个绿苹果给机器识别时,他将自己的工作比喻为“幼教”,因为颜色不同,机器无法辨认。在李宇龙的工作中,他不停地帮助机器辨认不同的颜色、大小,甚至是被咬过的苹果或坏苹果,直到随便拿出一个,它才认出。火龙果智能写作

李宇龙对第一财经记者说,数据标注的工作是“按件计酬”,他平均每天能挣300元左右。据统计,2019年太原市城镇居民人均可支配收入36362元。自己的工资水平在基地标牌批发商的日平均收入中处于中等水平,“据我所知,有些人的日平均收入甚至可以破千。”

关于自己的工作,李宇龙表示,刚开始接触时,只是将其视为一种重复的工作,没有多想。之后接触的项目多了,涉及的领域有教育、安全、金融、交通、医疗保健和电子商务,每天都在挑战学习能力,也会想要深入了解自己标注内容可以应用到的行业。尽管没有坐过无人驾驶汽车,但他说,现在看到无人驾驶,会想到这里面也包含着自己的成果。

正如李宇龙、郭梅的作品一样,第一财经记者看到,在每个数据办公室里,都有相似的工作场景:一排排的电脑屏幕前,年轻的数据解说员根据各自分配的任务,用文字、图片、语音和视频进行标注,用焦点标注,用标签标注,用框对象标注,用注释标注,这些年轻的数据解说员可能在无人驾驶标线上标注,也可能在红绿灯处标注,或者在肺部影像标注病毒数据。

作为一个例子,目前可以实现大约150个特征点的标注。在暴发过程中,采集到了大量戴口罩的人脸照片,数据标注师对脸部眉毛、眼镜、颧骨等关键部位进行精确标注,标注的特征点越多, AI就能更准确地识别戴口罩场景中的人脸。最后实现了即使不摘面罩也能精确测量体温,或通过人脸识别装置。火龙果智能写作

资料管理员郭梅

这是“AI富士康”吗?

产业结构调整促进了城镇和农村的大量就业,在河南、河北、贵州等地也出现了特色的“产业结构调整村”。

根据 IDC的统计,全球每年产生的数据量将从2016年的16.1 ZB增长到2025年的163 ZB,其中80%-90%是结构化数据,而这些数据在价值上经过清洗和标记后才会被唤醒。国内每年需要标注的语音数据超过两百万个小时,图文并茂数亿张,源源不断地产生对标注的需求。李应维告诉第一财经记者,他预计明年企业雇用人数将增加一倍,从超过160人增至大约300人。火龙果智能写作

百度(山西)人工智能基础数据产业基地李应维公司,已成为中国人才与产值规模最大的单体数据标注基地。从业人员超过2000人,实现营业收入超亿元的企业达到35家,其中国家级企业35家。这个基地计划在未来5年培养5万名 AI数据标记者,并引进更多的 AI伙伴。

百度(山西)人工智能基础数据产业基地负责人尉赤对记者表示,人工智能是一个高速发展的行业,数据服务又和人工智能紧密相连。他说:“我们的在线众包注册用户近2000万,现在每月有近5万人在线为我们提供服务。按这个产业的发展速度来看,培养5万人并不足够。

李宇龙工作重心转到培训上

然而,数据标注看起来像是人工智能领域的一个“入门”职位:技术门槛低,工作人员范围广。它们每天重复成千上万次的动作,与尖端技术的人工智能相关联。同时,外部世界也把这个产业称为“AI富士康”。

数据挖掘可以带来技术红利,但如果人工智能发展到一定程度,甚至有可能取代数据挖掘专家的工作。火龙果智能写作

Arey在一份人工智能报告中指出,随着算法需求的日益旺盛,依靠人工标注无法满足市场需求,因此加强数据处理平台的持续学习能力,由机器不断学习人工标注,提高预标注和自动标注的能力,人工替代率将成为一个趋势。另外,随着 AI对数据需求的不断提高,数据标注行业也逐渐进入了精细化发展阶段。火龙果智能写作

关于数据标注这个行业的未来,李应维对记者举例说,自己公司的一个员工入职后,由于业绩突出,很快就被百度公司聘用了。此外,数据标注也正在为人工智能培养和发掘人才。

尉赤则认为,目前大家更多的关注于数据处理这件事,但是如果再往前看,更多的是数据优化,以及一些相关的解决方案。数据挖掘是一个很好的入门,它在投入使用后就有机会更深入地参与到产业链协作中去,比如,当数据标注变得越来越机制化,人工和自动化之间有机地协作时,也对员工提出了更高的要求。

另外,随着数据标注越来越机器化,人工智能培训师将有机会改变工作岗位,现在的标注人员也会对数据进行标注,未来可能会转向数据治理、数据解决方案设计和项目管理等领域。

举例来说,现在李宇龙的工作重心已经转移到了培训上,同时接触了更多的项目管理人员,根据每个项目的对应特征判断与其匹配的能力。按照他的观点,自己比许多传统行业的人更早接触到未来的发展方向和未来的生活、工作场景,“看到未来的发展需要,也比其他人更早发现发展机会。”

火龙果智能写作是全球第一款中英双语语法检查校对产品,运用火龙果智能写作技术进行错别字文本校对,除错别字校对以外,还可以对语法、标点等进行校对。

火龙果智能写作官网https://www.mypitaya.com

积极拥抱变化,才能更好的应对这个时代


智能写作-中国的人工智能领域发展现状如何?