NaNoGenMo:人工智能写作与达达主义2.0 作者:蓬岸 Dr.Quest 编号:30640458 创建于:2017-12-03 03:39:11 修改于:2017-12-03 22:58:23 -------------------- 在今年六月份波士顿举办的@party上,来自MIT的程序写作专家Nick Montfort向 参与者介绍了电脑生成书籍的现状,程序写作(Program Writing)和电脑生成 文学(Computer-Generated Literary Art)并不完全等同于大众所理解的人工 智能写作,作为结合了生成艺术(Generated Art)和文学的交叉学科,它收到 了网络文学、乌力波、信息主义等文学现象的影响,而人工智能,也正在成为这 一领域中极其重要的研究工具。 (Image: https://picx.zhimg.com/v2-ea622f2ad42695d3d0a778ae0be44d58_720 w.jpg?source=d16d100b) 讲座中展示的这些图书都是由电脑程序写作完成的 there is no answer to this order of reasoning, except to advise a litt le wider perception, and extension of the too narrow horizon of habitu al ideas. (or there is an answer to this order of reasoning.)“这种推理 没有答案,除了建议更广泛的感知,和拓宽狭隘的既有观念的视野”(或许这种 推理会得到解答)——某算法原文:NaNoGenMo: Dada 2.0 (Link: http://arcade .stanford.edu/blogs/nanogenmo-dada-20) 标题图片:https://www.flickr.com/photos/nonstandardstudio/16121787737 (Link: https://www.flickr.com/photos/nonstandardstudio/16121787737) 今年早些时候,《华尔街日报》发表了一篇文章,这篇文章带有一个互动侧边栏 ,包括了一系列金融投资研究报告的片段。网站会提醒读者那一段摘录是由机器 人完成的,而又有哪些是由人类完成的。诚然,《华尔街日报》对简练文风的偏 爱让这种挑战更加可行。其中的一句话这样说到:“第二季度的现金结余8.3亿美 元,这意味着在第一季度减少1.4亿美元之后,第二季度又消耗了8000万美元”。 (Q2 cash balance expectation of $830m implies ~$80m of cash burn in Q 2 after a $140m reduction in cash balance in Q1),这句话实际上只包含 了三个数据点,并使用特定的语法合并在一起,而且不包含任何巧合的成分。像 记者这样的白领工作者可能还未必需要担心他们的饭碗(至少现在是这样……), 因为虽然新的自然语言生成(NLG)算法已经可以很好的在叙事文体中表达结构 数据,但目前而言仍然不够完善。这实际上是一种相当强大的能力,因为对于我 们来说,从数据中获得观点的本领往往依赖于数据的表现形式(比如说以图表展 现的数据可能会让我们漏掉某些特定的数据行或列)。而这与无中生有地创造一 个世界所需地胆量相差甚远。 自然语言生成算法通常会被归类于“人工智能”或“机器智能”地某种形式,因为它 们所做地事情——比如编写体育新闻或天气预报稿件,亦或是编写房地产广告,就 像我在快进实验室(Fast Forward Labs)的同事们所做的原型那样——而之前这 些事情只有人类能做到。(在另外的文章里我会探讨人工智能的历史,以及Nanc y Fulda等人所支持的相对概念)。 正如《华尔街日报》的文中所述,大多数人对自然语言生成算法的评价都类似于 André Bazin的评价:以现实主义作品的角度来看它缺乏技巧,而以算法艺术的 角度来看它又不够自动化。而商业化会将自然语言生成算法向着更写实的方向推 进,因为投行和福布斯这样的通讯社不会花钱购买机器智能来生成文风怪异的稿 件。反之,因为我们以人类的视角去评判机器智能,因此会将开发者向着更接近 人类文风的方向推进。 但是如果我们将机器生成文本的目标设定为另外一种风格呢?或者,我们不是以 人类的标准去评判(机器生成的文本),而是以其差异化去评判呢?其实机器或 许生成我们人类无法创造的东西——或者会自行创造——以至于摆脱算法的帮助呢? 自动写作是否有可能颠覆我们对自动化的理解,就像什克洛夫斯基(Shklovsky ,俄国形式主义学派的创始人)在《作为技巧的艺术》(Art as Device)所描 述的诗歌那样,为我们的创造力提供新的载体呢? (Image: https://picx.zhimg.com/v2-2a9e8d54b4bc5f1bca56e8ef9cda862e_720 w.jpg?source=d16d100b) 2014年NaNoGenMo参赛作品《Seraphs》,作者Liza Daly Github链接:https://github.com/lizadaly/nanogenmo2014 (Link: https://g ithub.com/lizadaly/nanogenmo2014) 这种利用自动化工具寻找新奇体验的过程正是全国小说生成月NaNoGenMo(Natio nal Novel Generation Month)的魅力所在,网络艺术家Darius Kazemi在2013 年11月灵光乍现似的创办了NaNoGenMo这一一年一度的写作机器人峰会。出于对 文学形式的思考,Kazemi开玩笑似的沿用了国家小说写作月NaNoWriMo(Nationa l Novel Writing Month)中仅有的两条规则:作品必须在30天内完成(11月份 )而且至少要写够五万字。这种不拘一格的创作要求启发了新的创作试验:既然 你可以编写某种可以创作小说的算法,那么为什么还要自己写小说呢?他将这一 想法发表在推特上,并创建了一个新的GitHub(一个基于网络的软件开发协作工 具)社区。 (Image: https://pic1.zhimg.com/v2-f1d6fdf04b89b96c17a3cb9d11215b8f_720 w.jpg?source=d16d100b) NaNoGenMo的官方Github:National Novel Generation Month (Link: https:// github.com/NaNoGenMo) 与NaNoWriMo类似,NaNoGenMo对所有人开放,而唯一的限制条件就是五万字的字 数要求,也正因如此,NaNoGenMo逐渐成为一种使用算法试验文学形式的复合艺 术运动。而这一团体的身份认同的形成一部分来自于对外界批评的反抗,许多批 评者称他们的作品为“入不了出版商法眼”的“混乱的机器人脚本”。去年,一位参 与者自嘲道“向普通人解释我们做所的事情是徒劳的。”而积极的一面则是他们正 在通过共享优质的关键资源来构建群体的认同感。John Ohno(别名enkiv2)发 布了可以生成六节诗、俳句和同义词的代码。而Allison Parrish(别名aparris h)则共享了其针对卡耐基梅隆大学发音词典(Carnegie Mellon Pronouncing D ictionary)开发的接口,这一接口可以为针对特定单词生成押韵词字典。最终I saac Karth(别名ikarth)向成员们揭示了这种利用既有文本重新组合成的诗歌 背后的理性根源——达达主义、威廉·巴勒斯(William Burroughs)的剪切技巧、 以及乌力波(Oulipo)面向约束(constraint-oriented)的作品。当我与Kazem i讨论这一项目的时候,他表示肯尼思·戈德史密斯(Kenneth Goldsmith)的《 不创意写作》激发了他针对如何让NaNoGenMo挑战人们对创作和创意的传统认知 的思考。 技术限制解释了为什么NaNoGenMo需要将自己和意境重构(recontextualization )和重组的诗学相结合。实际上真正的自然语言生成算法,就是那些可以构建单 词和语法、并切能够随着时间的推移变得更加智能的算法仍然处于非常早期的阶 段,2014年大多数的作品都是使用创造性的规则转换已有的文本,这也导致了作 品的相似性。 (Image: https://pic1.zhimg.com/v2-0597c619d232055d18e7afe04b1e4e90_720 w.jpg?source=d16d100b) 《搜索者》的部分文本,Github链接:thricedotted/theseeker (Link: https: //github.com/thricedotted/theseeker) 在2014年至少有两个作品使用了梦幻般的方式去探索机器智能的奇特美感。Thri cedotted的《搜索者》(The Seeker)是一本试图“通过阅读WikiHow来了解人类 行为”的机器的自传。这一作品充满着视觉美感,每一次算法操作的循环都会被 抽象的雨点和类似“想象没有一件事情是没有方向的。”(imagine not one thin g could be undirected.)这样的格言所标注。就像科塔萨尔的《跳房子》中跳 房子游戏的暗喻一样,这些格言鼓励读者去感知随机数据中有意义的部分(Thri cedotted的网络账号常常提到要“脑补”(apophenia))。电脑算法周而复始的 重复着“工作、扫描、想象”的循环,不断地抓取WikiHow的内容,并针对工作中 遇到的概念去搜索完全由文本构成的记忆,由此构建一个梦境的序列——或“抽象 概念”(univision)——来理解它所不知道的概念。这些概念包含了最令人惊讶的 诗歌作品,其美感源于阅读者不自主的从中获取的片段式的意境。 univision: change(required evolutions suddenly concentrating favourabl e structures. a chemical behind conclusions. determining the opinion i n the event. looking while happening. reciting the literature on the w ater. the position, existing. the amount around the resource. the task in the example. the selection near attempts. undergoing the layer and observing the object. the timeliness around the availability. Beginni ng memories…)概念:改变(需要进化突然集中有利的结构,结论背后的化学反 应。 确定事件中的意见。 在发生时观看。 背诵有关水的文献。 存在的位置。 资源周围的金额。 在这个例子中的任务。 接近尝试的选择。 正在经历的层和 观察对象。 与可用性相关的及时性。 开始回忆...)Allison Parrish的《我在 清水中淌过》(I Waded in Clear Water)则使用了情绪分析算法,它根据文本 的情绪特征对其进行分级,并据此规则解释并改写古斯塔夫斯H米勒(Gustavus Hindman Miller)的《10000个梦的解释》(Ten Thousand Dreams)。Parrish 依靠米勒书中公式化的“行为”+“含义”(action + denotation)结构(如 行为 :“看到橡树结满橡果”,含义:“意味着升职加薪”)。她首先将行为部分转换为 第一人称,简单的将句子重新处理(如“我看到橡树结满橡果”)然后根据情绪分 析算法所得出的结果,将“含义”部分按照从梦中最坏到最好的顺序重新排列。情 绪分数创建了短的章节比如:“我将车开到浑水中。我看到别人在除草”,和由一 系列不相干的行动组成的长章节:“我走下一层楼梯。我看到一个瘸子。我看到 我的爱人喝鸦片酒解愁。我听见嘲笑声。我停在窗台。我身上有虱子。我看到。 我丢掉了它。无论如何我都感到忧郁。我发出一条信息……”根据情感算法,在清 水中淌过是最好的梦。 (Image: https://pic1.zhimg.com/v2-d9c767d0bf79ce34750cb09705d2b45c_720 w.jpg?source=d16d100b) Moniker的推特机器人:@alltheminutes https://twitter.com/alltheminutes (Link: https://twitter.com/alltheminutes) 另外一些作品则是对推特信息的重组,阿姆斯特丹的Moniker设计工作室编写了 一个针对推特信息的简单查询,它搜索类似“这是 + 点 + 分 + 上午/下午 + 和 + ”这类结构的句子,构成一份包含全球日常活动的日记。这种“这是几点和我 是”的结构倾向于提取可预测的陈述或牢骚,而展示出程序是如何自动化的获得 我们的想法的:“这是12:29而我需要点饮料”“这是1:00pm而我还没有离开我的床 ”“这是11:00pm我终于得到了一杯咖啡。”《推傲慢与推偏见》(Twide and Twej udice)将奥斯汀原文中的对话以推特中相似内容的用词来替换,让对话看起来“ 更接地气”:(贝内特先生向贝内特太太打听宾利先生的事情)“他摆脱单身了吗 ?(Is he/she overrun 0r single?)”(贝内特太太对宾利先生的到来感叹道 ):“对我家傻妮们来说这真是太TMD好了(What _a fineee thingi 4my rageah olics girls!)”虽然这些作品不像《搜索者》那么复杂,但它通过将推特中的 用词掺杂进奥斯汀的作品这种方式,展现了当代媒体是如何改变传播规范的。 这让我们回到了我们对电脑生成文本进行评判的依据的那个假设:以文章是否读 起来像人类作品作为评判电脑作品的依据是迂腐的,因为什么样的语言能够被称 作“自然语言”的标准是相对的,而不是绝对的。我们自身的语言习惯是通过与其 他人的互动而建立的,这其中可能包括了特定的社会阶层,同事和同学,乃至在 我们的推特时间线上乱发垃圾信息的机器人。在Medium网站近期的一篇文章中, Katie Rose Pipkin 有力的解释了机器是如何改变、并且已经改变了我们对自然 语言的思考。无论我们承认与否,我们面对搜索工具和虚拟助手所使用的语言已 经与其他情形下有所不同,因为我们已经潜移默化的开始理解它们的工作方式, 并调整我们请求的方式以提高沟通效率。 机器学习领域的最新进展已经可以让机器发展出与我们类似的学习模型,不断地 个更新它们所表达的信息和表达的方式来适应我们的输入。Kazemi正计划在2015 年的NaNoGenMo作品中加入这种新的人机交流形式,让人和算法一起“合作”小说 ,算法会起草十个句子,然后他作为人类从中选择他认为最好的那句。“那么究 竟是谁写成了这本书呢?”他回答道:“(电脑算法)写作了文章中的每一个字, 而(我)则决定了正本小说的形式。”这种互动与基于IBM Watson构建的,面向 律师和医生的新研究工具非常类似:ROSS是一款基于Watson API的法律工具,它 可以展示特定问题的若干答案,而律师所要做的则是选择他们最喜欢的答案。如 果NaNoGenMo可以帮助我们更加深刻的思考这种人机互动,可能会为未来的人工 智能研究带来新的视野。