智能校对-AI智能写作人类文字工作还有多远?
编辑:pitaya02 日期:2020-09-01
人工智能再次诞生了,这次是本专业的教科书。
德国 Springer出版社是世界上最大的技术出版社之一,它在本月初出版了第一本完全由机器学习编写的教科书——《锂离子电池:由机器产生的研究摘要》(Lithium-Ion Batteries: AMachine-Generated Summary of Current Research)。本书长达247页,是 AI对近3年来锂离子电池领域150多篇杰出研究成果的总结,图文并茂。
本书署名作者 Beta Writer是一种算法,由德国法兰克福大学(Goethe University Frankfurt)计算语言学(ACoLi)实验室的 AI研究人员开发,它现在可以审查一大批给定主题的文献,并自动选择重要细节来呈现。斯普林计划在将来出版更多以不同科学研究领域为目标的书。
摘要型教材可以帮助相关研究人员迅速了解这个热门行业的最新发展,但是对普通人来说,教材太专业,离普通人太远。
本论文论述了 AI写作,下文专门介绍 AI写作。
此次出版的教科书算不上 AI的惊天动地, AI在文字创作上早已动作频频。
新闻是和我们日常生活联系最密切的文章。一些常见的体育赛事、经济行情、证券资讯等快讯、简讯类稿件背后可能都是 AI写的。人工智能不但可以发布事件和数据,还可以搜索相关的科普知识和系列报道,全程无人看管,加上自动排版排版,很难与真人作品区分开来。
新闻稿缺乏文学性,很难体现 AI的创造性。
人工智能也是视频制作。在1990年代,一些程序员开发了对话段生成器,称为 JAPE。随后, AI加持的升级版笑话生成器通过分析脱口秀的句式和笑点来生成段子,这个团队想要研究人们笑的原因。人工智能不仅可以写视频,还可以帮助科学家研究人类大脑中的笑神经。
人工智能很早就有小说了。纽约大学 AI研究人员 Goodwin在2007年训练了专门写小说的神经网络,在旅途中将 GPS、摄像机、麦克风传感器作为输入装置放置在汽车上,旅行结束后发布了 AI写的6千万字的《1 theRoad》,这被认为是第一部由 AI写的小说。这部小说的情节不太合理,既有 GPS定位数据,又有拼写问题。尽管无法通过图灵测试,但它以诗意的手法为 AI在文学中的应用开辟了新的思路。
广告词中有关主力出货的铁律真的读懂了你才是股票真正的高手!
“1 the Road”封面
人工智能写的小说还有获奖的机会。2016年,多个日本团队挑选了几篇 AI基于特定关键词和总体框架创作的科幻小说提交日本第三届“星新一奖”,其中一些作品已经通过了无知者评委的初审。一位来自日本的科幻小说家长谷敏思说:“能完整地写出小说是非常惊人的。假如100分我能拿到60分,那前途就会很好”。这次, AI不只是通过图灵测试,它还比人类写手的水平高。
人工智能有编剧的工作,剧本也被认真地拍成短片。《龙卷风》是伦敦国际科幻电影节(SFL)48小时命题电影挑战赛的参赛影片,该片由古德温训练的 AI机器人 Benjamin执导,讲述了未来世界三个主角的三角恋。这部电影请来了专业导演和知名演员主演,评价好坏参半,反面评论都说它不知所云,毫无意义,正面评价则认为这是 AI的壮举,没有什么比 AI编剧的科幻电影更科幻的了。这次试验,开创性超过了最终结果的质量。
“桑斯普林”剧照
人工智能还可以构建诗歌。2018年由微软亚洲研究院虚拟 AI助手小冰创作的139首现代诗歌汇集出版,成为首部 AI诗集《阳光打碎了玻璃》。从1920年开始,共收录了519位中国现代诗人的全部诗歌。非正式的人读起来感觉很美,很难区分诗人所写的不同,但是熟悉现代诗歌的人认为还有很大的发展空间。歌中,小冰与多家电视台及网络公司合作推出了单曲。
从玻璃窗子上掉下的一页诗
此外,其他风格的 AI也很容易上手。例如,对联、古诗等常使古代才子想破头,而由于对战要求严格,格律要求较高,这类文体对于 AI来说比白话要容易。在线生成对联、藏头诗等特色网站早已不是新鲜事。
人工智能的一些风格可以写得很好,而另一些风格却很难超越人类,这与其背后的程序算法密不可分。就拿小说来说,早期使用 RNN和 LSTM训练的模型网络很难通过图灵测试,而后期日本团队使用的新算法却能欺骗专业裁判。
人工神经网络
对自然语言的处理统称为 NLP (Natural-language processing),在此基础上将其粗分为语音识别 STT (Speech to text)、自然语言理解 NLU (Natural-language understanding)和自然语言生成 NLG (Natural-language generation)。本文所讨论的写作包括 NLG和部分 NLU。
在很早的时候,计算机的编写需要预设模版。初始模版就像我们在英语考试中做的完形填空,人写完文章后会有一部分扣空,然后让电脑根据数据填空。举例来说,天气预报通常是:今天某市某天气,最低气温某度,空气质量某等级。为避免使用扣空的死板模版,科学家们人为地建立了语法规则,以便当表达相同的意思时,能够在人前句的有限规则下进行多种变化。
目前 AI采用了统计方法。利用概率统计方法,通过输入大量的实际语料,预测词汇最可能的排列组合,从而自动训练模型网络。该模型不需要手工编写,除语法外,还包含了词性判断,实体区分,关键词抽取,情感分析等。在有模型的情况下可以实现 NLP的各个下游任务,也可以通过各种参数对 NLG进行精细控制。
除了研究现有的最佳模型能力几何,我们不讨论实现细节。
自从 OpenAI公司开放源代码 GPT-1.0以来, BERT和 GPT-2.0在 NLP行业中一直处于领先地位。18年10月, Google开放源码的 BERT模型打破了11项纪录,阅读理解部分也超越了人类。二月, OpenAI公布的 GPT-2.0通过更严格的训练获得了比 BERT更高的分数,甚至可以在指定的开篇继续写文章,不管是学术、新闻还是小说类型,网站上的续写例子都是有模式的,即使在“垃圾回收危害世界”这样的误导性话题继续写下去的时候,人们也仍然能够闲聊。
《循环利用对世界有害》主题的 OPT-2.0的延续
外国模式对中文的理解略有欠缺,国内也存在本土化研究。汉语是一种罕见的语言,它没有通过空格区域分词的形式,对词性和实体的理解需要特别处理。ERNIE模型是百度 PaddlePaddleProject于今年3月推出的,它通过输入百科、信息、对话等语料,直接对语义知识进行建模,提高了模型的语义表示能力,比 BERT在中文中更有效。
综上所述, AI技术一直在发展进步,书写技术也在不断完善,现在已经可以做到以假乱真了。
目前, AI已经应用于很多提高文本输出效率的领域。
和日常生活联系较大的是相对机械的规范写作模式,如新闻稿,报告文学等。
人工智能小编已被许多报纸和新闻机构采用。海外则是美联社的 WordSmith,华盛顿邮报的 Heliograph,纽约时报的 Blossom,国内则是新华社的“快笔小新”,第一财经的“DT新闻王”,南方都市报的“小南”,还有字节跳动的 Xiaomingbot,腾讯财经的 Dreamwriter,他们都有着惊人的发展势头。
新华网《快笔小新》
人工智能还到处写报告。一些需要提供证明材料、详细报告等资料的办事机构、咨询公司等部门,并不完全依靠人来撰写每份文件,而是将有关数据输入到 NLG,由 NLG按规范生成。例如,自助查询机上打印的个人信用报告由 NLG生成。极大的提高了办事和处理的效率,可以帮助机构更好的服务和拓展业务。
在新闻中提到的 AI的文摘生成能力不能仅仅应用于科学研究,结合商业才能更具活力。
在商业智能(BI)领域, AL得到了广泛的应用。由 Arria NLG、 Automated Insights、 Narrative Science等公司开发的 NLG模型可以实现将企业日常事务、财务信息等输入 AI, AI可以自动生成财务报表,包括目录、图表等结构,还可以指出特定业务中的赢利或亏损点和原因。企业的日常运作可以有这样一个助手,可以减少无谓的 ppt报告工作,可以帮助管理层及时调整战略。
ARRIANLG公司的样本分析报告
人工智能也可以在广告上打出身手。Phrasetech等国外公司提供了企业网站的自动生成,产品简介页,产品搜索结果摘要等服务。2018年京东、阿里相继推出了名为“莎士比亚”、“AI智能文案”的文案生成系统,可根据商品编号或关键字自动生成多个产品文案,甚至还可设置不同风格。结合 AI排版, P图,解决了小公司或者小企业设计人员和运营人员不足的问题。
人工智能在某些情况下并不完全适合人类,它也可以帮助人们变得更默默无闻。
计算机辅助写作还能提高人的写作效率。现在,百度、头条等自媒体都有自己的人工智能写作平台,主要是用来后期根据语义进行纠错。书写时, AI笔神这样的产品可以在每一次输入词句之后,根据词云的语意反馈到灵感,诗词名言,小说情节摘要等信息,帮助作者获得灵感,素材,使书写更流畅。
除商业化外, AI还可以在日常生活中提供帮助。聪明输入法在输入单词时,会不断地猜测单词后面的意思,有时候打个开头就可以选择单词后面的句子。即使是追星这样的需求,利用 NLG也能梳理出某件事的来龙去脉以及明星的生活经历,全方位把握明星的点滴。
综上所述, AI已经在文字领域得到了广泛的应用,可以部分替代或辅助人类的工作。
人工智能取代人逐渐成为现实,这与 AI的特性密不可分。
人工智能能接受大量的数据输入。我们的人生有涯,而我们的知识无涯。作者的知识储备和精力是有限的,遇到未知领域时要及时补充知识。而且 AI可以将数据挖掘出来的全部数据信息作为输入,可以了解各个细节,做到旁征博引。
客观化的输入内容。人类以万物为刍狗,不仁。因为人的经历和知识水平的差异,人们对于所获得的信息内容的认识,不可能做到完整和客观。人工智能跟踪训练出的模型网络,对所有的输入进行全面分析。AI给出的相同模型、参数的结果完全一致,即同一 AI对任何输入都采用相同的评价标准。
人工智能能实现快速输出。急不可耐,没有掩耳盗铃。借助于现代计算机技术带来的强大算力, AI可以做到秒写。经过实时数据挖掘,收集,立即送到 AI处理,瞬间输出结果。相对于人类编辑主动搜索、阅读和遣词造句的时间, AI已经可以忽略时间成本。
人工智能可以省去人工。昨天的日子不可追,今日的日子不可追。人工智能使写作自动化或半自动化。对企业而言,可以节约人力成本。对整个人类来说,科技的进步使人类摆脱了枯燥的,重复性的工作,做出了其他创造性的事情。
总之,由于 AI的诸多优点,在部分求快求准的写作场景中, AI取代人类已势在必行。
在这个阶段, AI还存在很多局限,社会对它的认识和接受也不高。
目前的 AI技术是利用数据科学的概率统计方法,对文献中的句子进行分析,以求达到人类相似的水平。理论上讲,语言是有限字词的组合,可以通过数学方法来求解。该方案的部分可行性已经过实践验证,但是否会在未来遇到瓶颈,目前尚无验证方法。
一场娱乐界的小热点巧合成了佐证。一八一八年,李宏烨博士在一个电视节目中提出“相声公式”呛声郭德纲,引起社会的热烈讨论。出版了3部关于相声数学方面的专著,理论体系完备。现场观众反应良好,但是他说相声没有火,事后相声又再次走红。
李宏烨在节目中展示公式
当前所研究的 AI仍存在许多问题。
第一, AI所写的文章质量不高。鬼鬼祟祟的人,文章恨恶的人。新闻等语言平实、严谨的文体与需要有情节和人物塑造的小说有着很大的不同。人工智能所写的小说、诗歌等等,往往缺乏内在逻辑和情感,让人看得眼花缭乱。
二是 AI缺乏独创性。《李杜诗篇万口传》中的万口传,人工智能模型训练完成后,句式等结构被确定下来,尽管可能有更多的数量,但有局限性。当使用 AI模型时,所有数据、视角等信息都来自于输入,通过删减、重新组织输出过程,不会出现跳脱现象。
最终, AI的培训投入巨大。喝一块石头,就会使你的财富增加。为了建立一个良好的 AI模型,目前需要预先的算法培训费用巨大。培训所用的语料要大,最好还能预删以提高质量。为了处理大量的训练数据,需要花费昂贵的 GPU计算时间。要想提高训练速度,需要建立 GPU机器学习集群来加快速度。现在,大公司完成了这些工作,并且免费发布模型,但是 OpenAI封闭源代码 GPT-2.0使人们担心这种模式能否持久。
科技发展过程中遇到了技术问题,人类如何利用科技也是如此。人工智能作为技术,谁都能使用它。用它来做什么,需要如何承担责任,道德规范和法律制度都不完善。
人工智能可用于制作假新闻。不管输入到 AI中的是什么命题, AI都能写出似乎有理有据的文章,让人信服。人工智能也不能通过联系相关单位或专家来确认数据和信息的可靠性,因此 AI会相信所有的信息。假使人输入了错误的信息, AI会直接认可,这样也会造成偏差。
人工智能可用于洗稿。AI改变了句子结构,语序,它可以输出一篇原始的文章,但却不能输出一篇新的文章。人工智能洗稿在媒体的投稿、大学的论文、报告的撰写等方面有着旺盛的需求。如今市场上出现了文章原创与伪原创、文章查重与反查重等官民 AI力量的打法。
人们甚至怀疑 AI操纵民主投票。不管是美国大选还是英国退欧公投,都有人认为有力量在社交媒体上做精确的广告。通过对用户历史的分析, AI可以找到最适合他的拉票策略,通过 NLG生成拉票文案配图并将其推送给他。例如,某些社交网站用户不喜欢移民, AI就会不断地为那些摇摆不定的选民刷广告,例如“英国留欧后将有多少移民涌入英国”等移民主题。这样做的效率远高于传统的通过电视演讲拉票的方式。
影片“脱欧:不合理的战争”详述了社交网络精准广告投放对投票过程的影响
在法律不完善的情况下, AI被滥用的方式层出不穷,以上就是其中的一小部分。法律上对 AI作品版权归属的争议主要集中在 AI作品的著作权归属问题上。
人工智能用的是程序员在科技公司写的程序,算法是专家学者写的论文,训练样本来自名著,百科,论坛评论等等,输出的是程序员无法理解的黑盒模型,最终公司又开放了模型,让用户自己输入模型,用户自己把模型开放源代码。最后产生的文章版权确实很难界定。
总之, AI目前正处于发展的初级阶段,需要解决各种各样的问题。
目前的 AI水平不高,但是未来的潜力是可以预见的。
科技方面, AI有望创造。因为最核心的原理不能被证明,而且 AI的重构、模仿能力已经得到了证实,未来算法的优化和硬件运算能力的提高可能会让 AI具有创造性。人工智能一旦获得了创造性,文学、音乐、电视电影等产业就会发生翻天覆地的变化。
在应用方面, AI未来可以结合自己的技术实现更强大的功能,扩展使用场景。将语音识别和数据挖掘技术结合起来, AI或者能够在现场演讲、新闻报道等场景中实时核实事实并同步输出。AI与图像、音视频识别技术相结合,可以生成多种媒体的叙述性描述,将电影、电视、游戏还原为小说、剧本和摘要,使用户在选择娱乐内容时更加方便,同时照顾到某些残疾人群体的娱乐需求。文本作为信息传播的基本媒介,其所能挖掘的场景太多。
在社会上,当伦理、法律问题解决了, AI就可以扫除障碍,良性健康的发展。遏制滥用 AI行为可以增强人们对 AI的接受程度。版权归原作者所有,才能真正实现对科技发展的反哺, AI在取代部分工作的同时,也会带来新的产业和就业机会。
综上所述, AI在广阔的天地下将会大有作为。
结论
在弱人工智能阶段,想要 AI进行艺术创作是不现实的,但利用好现有的技术优势仍然具有相当的应用价值。人工智能技术值得人们继续研究,未来的想象空间很大。