盘点AI写作历史,AI取代人类文字工作还有多远?
2019-04-18 13:34:13
  • 0
  • 0
  • 1


AI又出书啦,这次是本专业的教科书。

世界上最大的科技出版社之一,德国Springer(斯普林格)出版社于本月初出版了第一本完全由机器学习编写的教科书——锂离子电池:机器生成的目前研究摘要(Lithium-Ion Batteries: A Machine-Generated Summary of Current Research)。该书长达247页,是AI总结出的锂离子电池领域的近3年超150篇突出研究成果的摘要,图文并茂。

该书署名作者Beta Writer是由德国法兰克福大学(Goethe University Frankfurt)应用计算语言学(ACoLi)实验室的AI研究人员开发的算法,此算法现能审阅给定主题的大量文献并自动挑选重要的细节呈现。Spring计划在未来利用该算法出版更多针对不同科研领域的书籍。

这本摘要式的教科书可以帮助相关科研人员快速了解这个热门行业的最新进展,但对于普通人来说内容过于专业和遥远。

本文讨论AI写作,下文中的AI特指写作型AI。

不仅教材,段子、小说、剧本、歌词、诗,AI写作统统包揽

这次出版的教科书算不上是AI的惊天大动作,AI在文字创作上早已动作频频。

与我们日常生活联系最紧密的作文是新闻。常见的一些体育赛事、经济行情、证券信息等快讯、简讯类稿件背后可能是由AI编写。AI不仅能发布事件和数据,还能搜索到相关科普知识和系列报道,全程无人执守,再加上自动配图排版,与真人采编作品难以区分。

新闻类稿件缺乏文学性,难以体现AI创造性的一面。

AI也是段子手。上世纪90年代,就有程序员开发了名为JAPE的对话式段子生成器。之后,AI加持的升级版笑话生成器通过分析脱口秀的句式和笑点生成段子,团队希望借此研究人为什么会发笑。AI写段子的同时还能辅助科学家研究人脑的笑神经。

AI早就写过小说。2007年,纽约大学AI研究员Goodwin训练了专写小说的神经网络,公路旅行时在车上安放GPS、摄像头、麦克风传感器作为输入,旅行结束后一字未改发表了AI写成的6千万字《1 the Road》,被认为是第一本由人工智能写的小说。该小说情节并不完全合理,夹杂着GPS定位数据,还有拼写问题。小说虽然通不过图灵测试,但用诗意的手法开辟了AI在文学应用上的新思路。


《1 the Road》封面

AI写的小说还有机会获奖。2016年,日本多个团队挑选了几篇AI根据指定关键词和大体框架生成的科幻小说投稿了日本第三届“星新一奖”,部分作品通过了不知情评委的初审。日本科幻小说作家长谷敏思表示,“能够完整写出小说太令人震惊了。如果100分满分的话我给打60分,未来令人期待”。这次,AI不仅仅是通过图灵测试,而是能与人类作家一较高下了。

AI做过编剧,剧本还被认真拍成短片。作为伦敦国际科幻电影节(SFL)48小时命题电影挑战赛参赛影片,《Sunspring》的剧本是由Goodwin训练的AI机器人Benjamin编写的,讲述了了未来世界3位主角的三角恋关系。本片请来了专业导演和知名演员出演,评价是喜忧参半,负面评论都是说它不知所云,没有意义,正面评价则认为这是AI的壮举,没有比AI编剧的科幻片更科幻的了。这次实验,开创性大于最终成果的质量。


《Sunspring》剧照

AI在诗歌上也有建树。2017年微软亚洲研究院的虚拟AI助手小冰写的139首现代诗集结出版成了第一部人工智能诗集《阳光失了玻璃窗》。训练样本是1920年起519位中国现代诗人的所有诗歌。非专业人员读起来觉得优美,难以和诗人写的区分,但熟悉现代诗的人认为还有很大的进步空间。在歌曲上,小冰曾与不少电视台和互联网企业合作推出单曲。


《阳光失了玻璃窗》中的一页诗

另外,其他的文体AI也是能轻松上手。比如,对联、古诗词往往使古代的才子想破头,而由于有严格的对仗、格律要求,这类文体对AI来说却更比白话文轻松。网上生成对联、藏头诗等等功能的网站早已不新鲜。

AI写作背后,是一场AI技术进化史

AI有些文体能写得很好,有些文体却难以超越人类,这与它背后的程序算法是分不开的。以小说为例,早期使用RNN和LSTM训练的模型网络难以通过图灵测试,而后期日本团队使用的新型算法就能够骗过专业评委。


人工智能神经网络

对于自然语言的处理统称为NLP(Natural-language processing),下又粗分为语音识别STT(Speech to text)、自然语言理解NLU(Natural-language understanding)和自然语言生成NLG(Natural-language generation)3块。我们主要讨论的写作涉及到NLG和部分NLU。

早期,要让计算机写作需要预设模版。最初的模版就像我们英语考试中做的完形填空,人写完文章后将会变化的部分扣空,再让计算机根据数据填空。例如,天气预报中常见的:某城市今日某天气,最高最低温度某某度,空气质量某等级。为了不使用扣空的死板模版,科学家人为地将语法规则建模,这样在表达相同意思时,句式可以在人前期设定的有限规则内有多种变化。

现在,AI运用的是统计学方法。通过输入大量真实语料,使用概率统计,预测出词汇最可能的排列组合,自动训练出模型网络。这个模型无需人工编写,除了语法外,还包含词性判断、实体区分、关键词句提取、情感分析等等。当有了模型就可实现NLP的各下游任务,还可通过各种参数精细地控制NLG。

我们不讨论实现细节,只看看现有最好的模型能力几何。

自OpenAI开源GPT-1.0后,在其上改进的BERT和GPT-2.0是目前NLP业内最高水平。Google在18年10月开源的BERT模型破11项记录,部分阅读理解能力还超过了人类。今年2月OpenAI透露的GPT-2.0通过更大的训练得到了比BERT更高的分数,甚至可以通过给定开头续写文章,无论是学术、新闻还是小说类型,官网公布的续写示例都有模有样,甚至在续写“垃圾回收对世界有害”这样的误导话题时依然能侃侃而谈。


OPT-2.0对“回收对世界有害”话题的续写

国外模型对中文的理解能力稍差,国内也有本土化研究。汉字是少见的不通过空格区分词汇的语言,在理解词性和实体上需要特殊处理。百度PaddlePaddle项目今年3月发布了ERNIE模型,通过输入百科、资讯、对话等语料库和直接对语义知识进行建模,增强了模型语义表示能力,较BERT在中文上的效果更好。

综上,AI技术一直在发展和进步,写作技术也在不断完善,目前已可以假乱真。

AI写作行行都能用,应用场景全覆盖

AI现已运用在许多方面以提升文字产出效率。

与日常生活联系较大的是相对机械的模版规范化写作,如新闻稿、报告文学等等。

AI小编已经为多家报社和新闻机构所采用。国外有美联社的WordSmith、华盛顿邮报的Heliograph和纽约时报的Blossom ,国内有新华社的“快笔小新”、 第一财经的“DT稿王”、《南方都市报》的“小南”、字节跳动的Xiaomingbot、腾讯财经的Dreamwriter,发展势头迅猛。


新华社发布的“快笔小新”

AI也在各处写报告。办事机构、咨询公司等部分需要提供证明材料、详细报告等等的场景并不全靠人工去撰写每一份文档,而是把相关数据输入给NLG,由NLG根据规范生成。比如,在自助查询机打印的个人征信报告就是NLG生成的。NLG大大提升了办事和处理效率,能帮助机构更好地服务和拓展业务。

新闻里提到的AI的摘要生成能力不仅仅能用于科研,与商业结合才能有更大的生命力。

AL广泛运用在商业智能(Business Intelligence,BI)领域。Arria NLG、Automated Insights、Narrative Science等公司开发的NLG模型能够做到将企业日常事务、财务信息等输入AI,AI自动生成财务报表,包括目录、图表等结构,并能指出各盈利或亏损点和具体到某个业务的原因。公司日常运营能有这样一个帮手,能减少无谓的做ppt报告的工作,并能帮助管理层及时调整策略。


ARRIA NLG 的分析报告示例

AI在广告上也能大战身手。国外的Phrasetech等公司提供自动生成公司网站、产品介绍页面、产品搜索结果摘要等服务。京东、阿里在2018年相继推出了名为“莎士比亚”、“AI智能文案”的文案生成系统,能根据商品编号或关键词自动生成多条产品文案,甚至能设置不同的风格。和AI排版、P图相结合,能解决小公司或商家设计师和运营不足的问题。

AI不能完全胜任的场合,也可以通过更默默无闻的方式帮助人类。

AI写作辅助也能够提升人类的写作效率。目前,百度、头条等自媒体都有自己的人工智能写作平台,主要用于后期根据语意纠错。在写作时,AI笔神这类产品能在每次输入词句后,根据语意反馈灵感词云、诗词名言、小说情节摘要等信息,帮助作者获得灵感、素材,使行文更加顺畅。

除了商用,AI在日常生活中也能帮上忙。智能输入法们在打字时不停地猜测之后的内容,有时打个开头就能一路选候选词打完一句话。哪怕是追星这类需求,利用NLG也能够梳理出某个事件的来龙去脉和明星的生平履历,全方位掌握明星的点滴。

综上,AI已经在文字领域应用广泛,已能部分替代或辅助人类的工作。

AI写作实力超卓,在某些方面人类早已不是对手

AI接替人类已经慢慢成为现实,这与AI的特点是分不开的。

AI可以接收大量数据输入。吾生也有涯,而知也无涯。人类作家的知识储备和精力是有限的,当遇到未知领域就要去补充知识。而AI可以用数据挖掘出的全量数据信息作为输入,能了解到各细枝末节,做到旁征博引。

AI对输入内容客观。AI不仁,以万物为刍狗。人类由于自身经历、知识水平不同,对于获取到的内容、信息看法并不能做到完整、客观。AI遵循训练出模型网络,完整分析所有输入。同一个模型、参数下AI给出的结果是完全一致的,也就是说,同一个AI对任何输入都使用同一套评价标准。


时间和成本无需单选

AI可以做到快速输出。迅雷不及掩耳。AI借助现代计算机技术带来的强大算力,能够做到秒速作文。通过实时的数据挖掘、收集,立刻送至AI处理,瞬间就能输出结果。相较人类编辑主动搜索、阅读再到遣词造句的时间,AI已经可以将时间成本忽略了。

AI能够省去人工。昨日之日不可追,今日之日须臾期。AI做到了自动化或半自动化写作。对于企业来说,人员成本可以节省下来。对于全人类来说,技术的进步把人类从枯燥、重复的劳动中解放出来,做其它富有创造性的事。

综上,由于AI的种种优势,在部分求快求准的写作场景,人类被AI取代是必然。

当前AI写作还是傻白甜,同时法律缺位时AI写作技术还被人利用和滥用

现阶段的AI还有不少局限性,社会对它的认识和接受程度也不高。

当前AI技术在用数据科学的概率统计方法去分析文学性的文章句子,以求达到人类相似的水平。从原理上,语言是有限字词的排列组合,可以用数学方法解决。这条路已经通过实践证实了部分可行性,但是否会在将来遇到瓶颈,现在没有办法验证。

一个娱乐圈小热点机缘巧合成了佐证。18年,一位交大博士李宏烨在电视节目上提出“相声公式”呛声郭德纲,引发了社会大讨论。他曾出版3本用数学方法研究相声的书籍,理论体系完备。现场观众反应良好,但他说的相声15年未火,此事过后再次销声匿迹。


节目上李宏烨展示他的公式

目前研究出的AI还存在不少问题。

首先,AI所著文章质量偏低。魑魅喜人过,文章憎命达。AI在新闻等语言平实、严谨的文体与需要有情节和人物性格塑造的小说的表现差异巨大。AI撰写的小说、诗歌等往往缺乏内在逻辑和情感,让人看得云里雾里。

其次,AI缺乏原创性。李杜诗篇万口传,至今已觉不新鲜。AI模型训练完成后,句式等结构就确定下来了,虽然数量上可能较多,但是有限的。AI模型在使用时,所有的数据、观点等信息都来自于输入,通过删选、重组流程输出,不会有跳脱。

最后,AI训练投入巨大。一饮一石者,徒以多为贵。要想AI模型好,目前算法要求的前期训练成本是巨大的。训练时用的语料库要庞大,最好还要预删选以提高质量。训练时为了处理海量数据需要占用昂贵的GPU计算时间。为了能更快地训练,需要组建GPU机器学习集群来加速。目前,大公司做了这些工作并免费发布模型,但OpenAI闭源了GPT-2.0让人担忧这样的模式是否可持续。

技术在发展中遇到问题,人类又如何去利用技术也出现了问题。AI作为技术,谁都可以利用。利用它做什么,需要负起怎样的责任,道德标准和法律体系还没有完善。

AI可以用来做假新闻。无论输入给AI什么命题,AI都能写出规规矩矩看似有理有据的文章,让人真假莫辨。AI也无法通过联系相关单位或求助专家来确认数据和信息的可靠性,所以AI会相信所有的输入。如果人为输入虚假信息,AI会直接认可,这样也会造成偏差。

AI可以用来洗稿。一篇原创的文章输入,AI改变句子结构、语序,能输出一篇转述后的但没有新价值的文章。AI洗稿在自媒体投稿、大学论文、报告撰写都有旺盛需求。现在市场上出现了文章原创和伪原创、论文查重和反查重等官方和民间AI势力的斗法。

AI甚至被质疑操纵民主投票。无论是美国大选还是英国脱欧公投,都有声音说是有势力在社交媒体上投放精准广告。AI能通过分析用户的历史,找出最适合他的拉票策略,通过NLG生成拉票文案配图后推给他。比如,某社交网络用户不喜欢移民,AI就会根据移民话题生成诸如“留欧后英国将涌入多少多少的移民”等等文案持续刷屏,以此获取摇摆选民的投票。这比传统的、通过电视演讲的拉票方式要高效得多。


电影《脱欧:无理之战》详细展示了社交网络精准广告投放影响投票的过程

法律不完善时,AI被滥用的方式层出不穷,以上只是一小部分。在立法过程中,不少问题都难以界定,一个争论的焦点是AI作品的著作权归属问题。

AI使用的是程序员在科技公司编写的程序,算法是专家学者在论文中公开的,训练样本又来自名著、百科、论坛评论等各处,产出的是程序员都不能理解的黑盒模型,最后公司又将模型开源了,使用模型的人是输入的自己的数据。最终生成的文章著作权实在难以界定。

综上,AI现在处于发展的初级阶段,有各式各样的问题亟待解决。

长期来看AI写作,若大规模应用落地,未来可期

当前AI的水平较弱,但未来的潜力是可以预见的。

技术上,AI有望能创作。由于最核心的原理无法被证伪,并且现在AI重组、模仿能力已经得到证实,未来算法的优化和硬件算力的提升都可能使AI得到创作的能力。AI一旦获得创作能力,文学、音乐、电视电影等行业因此会产生翻天覆地的变化。

应用上,AI未来能结合其技术实现更强大的功能,拓展使用场景。结合语音识别和数据挖掘技术,AI或能够在演讲直播、新闻播报等场景下进行实时的事实核查并同步输出。结合图像、音视频识别技术,AI将能够生成各种媒体的叙述性描述,将电影、电视、游戏还原为小说、剧本、摘要,用户对文娱内容的挑选会更方便,也能同时照顾到一些残障群体的娱乐需求。文字作为信息传播的基础媒介,可以挖掘的场景太多。

社会上,伦理、法律问题解决后,AI能够扫除障碍,良性健康发展。滥用AI行为被遏制能加强大众对AI的接受。著作权归属解决后能够从实际收益去反哺技术的发展,AI取代了一部分工作的同时也会催生出新的产业和工作机会。

综上,AI在广阔天地下将大有所为。

结语

弱人工智能阶段下想要AI进行艺术创作还不现实,但利用好现有技术优势仍有可观但应用价值。AI值得人们继续深入研究,未来想象空间巨大。

文/首席发言者公众号


 
最新文章
相关阅读