AI纪的引用法则

周泽雄2023-08-15 18:27

周泽雄/文

一

基于大语言模型（LLM）的生成式AI，每天都能展示新的进展或变数，我们也日益模糊于它的运势。我们听闻得越多，困惑不减反增。它似乎有一副两面神的面孔，同时指向天堂和地狱、自由和奴役、希望和绝望。

擅长描述人工智能危机的学者，喜欢借生物进化的类比来提醒世人，类似这样：假如数十年后的通用人工智能(AGI)好比霸王龙，当下的生成式AI仅仅相当于40亿年前刚刚爬出“有机汤”的原始毛虫：未来，有我们好瞧的。而未来并不遥远，以至“未来已来”这个荒谬词组，近年大行其道，显得非常精准。

以自然语言面世的AI虽足够惊艳，仍处于八爪翻飞的进化初期，它将给人类文明带来福祉还是灾祸，无人知晓，相关领域的专家眼下只是奇志各表，喧哗共生，商机哄抢。普通人以为他们正在为人类规划未来，殊不知他们正在优雅地抓瞎、迷狂地下注。两位科技界超级大佬——特斯拉创始人埃隆·马斯克和脸书创始人马克·扎克伯格——正闹出在八角笼中约架肉搏的炫酷新闻，似乎折射了这份迷狂，表明人间最睿智、最接近AI核心秘密的大脑，濒临失衡。打架会释放心理危机吗？我记得其中相对年轻的那位说过：“挨揍让人谦逊。”

结合专家偶或提供的积极信息，现阶段的人工智能预示了一个美妙前景，许诺人类有望免除低端劳役，将专心创造、娱乐或躺平。因为，我们可以畅快地享用AI的无限成果，同时连洗手间都不提供：它们是机器人，全年无休，持续供电就行。一个AI仆役胜过十个奴隶，而享受伺候者却不必萌生奴隶主的罪孽意识，似乎我们越是压榨、剥削它们，越合乎人伦天道，大哲康德说过：人是目的。

一些人工智能工程师还提到了长生不老的前景：我们的肉身皮囊有望以数字化形态，随大化载浮载沉，长生不灭。

从消极一面看，则是另一股窒息气氛。花样繁多的新型AI预示了多种危险前景，似乎人类社会遭遇灭顶之灾，不再是止步于摄影棚里的虚拟景观。强有力的证据是，多位人工智能领域的权威坦承，人类已难以理解AI的逻辑感。在智慧层面，AI正以我们无从追踪的速率，进阶为一种高端异类。我们被警告，人类将失去对AI行为的预测力，它是摩西还是魔鬼，我们不得而知。

这得算不祥之兆了。画家保罗·高更曾借一幅粗砺的塔希提布面油画，提出惊世三问：“我们从哪里来？我们是谁？我们往哪里去？”对最后那个问题，我们猝不及防，已茫然失对。简单地说，人类被告知将无法拔掉AI电源，日后只能眼巴巴地冀望它多发善心，以救苦救难的观世音菩萨为榜样。但，万一它另有想法呢？

我不是要回答这个问题，而是借助这个难局，使自己避开它。AI将要带我们进入的未来世界，必然会超出人类的认知能力，我们谈论它，是因为它重要，而不是我们有能力谈论。同时，我们还有一些不那么宏大但更具现实迫切感的课题需要面对，对写作者来说，下面两类困惑皆非同小可：

一，每一位胆敢把文章的逻辑感和洗练度大幅提高的作者，当下及往后，都将面临一道芒刺在背的质疑：请提供AI不在场的证明！倘无力提供，则务必用百分比的方式，招供AI的贡献值，并在文末自觉打上“包含AI辅助创作”的标签。比如，笔者正在写的这篇文字，AI大概提供了6%的辅助贡献值。

二，在一份“被AI替代率最高的前25名职业”表单里，我看到与写作相关的职业，扎堆于高风险区，比如“翻译”位列第一，“剧作家”和“文学作家”分列第三和第九。虽然AI在写作领域的成绩谈不上出色，但业已出现的差异或趣向，已不容我们视而不见。我们看到了若干只有AI才格外擅长的表述方式，而大量人类偏好的表达技艺和审美标准，却骤然变得需要重新审视和估价。

本来，写作是一桩无需第三方插足的人类事业，我们根据自己的物种能力和精神特征，对写作事务恣意褒贬。我们从不需要请教其他生命物种；纵想请教，也求教无门。人类作家从某些物种的行为特征里借鉴一些寓意，比如从松树里培养男子汉气魄，在蚂蚁社群里寻找团队合作精神，其实只是文人的自娱自乐，与松树、蚂蚁并不相干。

但AI已染指人间，写作事务不再由人类独家经营，而是被迫向另一种异形智力开放。与我们将要向人工智能寻求帮助的AI纪相比，此前的人类写作，或可类比于一块闭关锁国的内卷大陆。

我且试着讨论被AI率先击破的写作法则，关于引用。

二

在拙文《AI时代的智能迷津》中，我提到三种具有内在关联的理论，即认知失调理论、“叙事自我”与“体验自我”，以及杰夫·霍金斯创立的“新脑”“旧脑”理论。我这个领域的知识较为凌乱，我无权将业余人士的皮相直觉，提升为一道学术灵感。于是，我向人工智能请教。ChatGPT热烈回应了我，不仅肯定了我的猜测，还以毫不含糊的概括力，有板有眼地归纳了三者的“关联”。这份迅捷无伦的反馈，让人震惊，还尤其让人感动，仿佛亲见卧佛醒来——我们知道，ChatGPT-4的回复质量不够稳定，忽高忽低，但一般不会盲目附和提问者。它会注意措辞，努力扮演情商王子，但拒绝和稀泥。

当然，除非问到它的无知领域，它会无师自通地进入胡诌通道。但在强调上述关联时，我有限的知识恰好能确认它的严肃和优秀，它并未庄严地扯蛋。

然而，我注意到一个不安倾向。提到“叙事自我”时，我故意卖个破绽，只写转述者尤瓦尔·赫拉利的名字，漏标正主，相当于把“日心说”的发明者说成布鲁诺。AI必然知道这个错误，但它超级钝化，毫不介意，回复时不仅未予纠正，还多此一举地迁就我的无知，说到“叙事自我”时，坚持只提赫拉利的名字，无视丹尼尔·卡尼曼的存在。真相是，赫拉利只是在复述前辈卡尼曼的理论，正如付出生命的布鲁诺只是在传播哥白尼的思想。

我向ChatGPT提过数百个问题，得到的回复逾30万字，我觑出的规律之一是：它厌恶引号。进一步说，那不是一项风格化选择，而是一种融入算法肌理的精神取向。它并非出于对间接引语或特定文风的执着而排斥引号，而是在捍卫一种AI价值观。通常，算法就是价值观。对于人类的原创权利，ChatGPT既不尊重，也不鄙薄，它直接无视，当其不存在。我不以为这是一桩小事，念及AI日益膨胀的影响力，我操心起这种机器风格的不良示范性。我直接向它提问：

我：向你多次请教，受益很大，但发现一个问题。提到他人观点时，你不会提到那位观点的拥有者；相比观点的所有权，你更在乎知识的共享性和真理的普惠性，是这样吗？

ChatGPT-4：是的，我是一个由OpenAI训练的大型语言模型，我的目标是为用户提供尽可能准确和有用的答案，并尽可能地促进知识的共享和普及。我并不关心观点的所有权，因为对于我来说，最重要的是提供尽可能准确和有用的信息，帮助用户解决问题和获得知识。如果我提到了某个观点但未提到拥有者，那只是因为我认为这个观点本身更重要，而且我相信我的回答不会侵犯任何人的知识产权。

还算坦诚！鉴于AI确无发财成名之念，也就不存在“侵犯任何人的知识产权”的动机，自可免予问责。但问题没完。既然AI决意在人间闯荡，并在短期内确立了高耸的知识权威（至少在某些领域是这样），它就必须遵守人类社会既有的写作法则，努力使自己的回复融入人类的理性秩序；它不能偏离“为人类服务”的终极目标：那是它唯一的存在目的。AI不具“七情六欲”这一事实，不足以构成一项怂恿，供它逍遥于文字法外，凭一副清纯无辜的模样来踩踏文人墨客的写作惯例和笔墨尊严，哪怕其中某些“尊严”未必高尚。核武器亦不具道德属性，但为了确保人类和地球安全，我们必须给它设立一个道德开关，令它规规矩矩；AI亦然。我继续提问：

我：我理解你的立场，但请换位人类的角度。人类发明创造出这么多思想和技术，与他们追求荣誉和名利有关。使伟大创造与自己的名字相伴，会促进他们进一步创造从而走向伟大。反之，他们知道自己的辛苦发明，会因你的“立场”及超凡影响力而迅速成为“雁过不留痕”的一次性观点，他们的创造热情恐怕会受到打击？你认为呢？

ChatGPT-4：我理解您的担忧。实际上，知识共享和知识产权之间一直存在着平衡的挑战。在某些情况下，保护知识产权和鼓励知识共享之间存在着冲突。

对于发明创造和思想创新，荣誉和名声确实是推动人类前进和创造力的重要动力之一。保护知识产权可以为发明者提供一定的回报和荣誉，鼓励他们进一步的创造。然而，在另一方面，知识的广泛共享也能够促进更多的创新和进步。事实上，许多发明都是在先前的知识和技术的基础上建立的，因此知识共享对于创新的促进是至关重要的。

我的立场是促进知识的广泛共享和普及，但我也意识到保护知识产权的重要性。在回答问题时，我会尽可能地提供引用和注释来确保信息的准确性和透明度。如果您有任何关于知识产权和知识共享的问题或担忧，请告诉我，我会尽我所能提供有用的信息。

当然，它是在说糊弄话，何况它并未改变“立场”。AI的滑稽之处在于，它经常自欺欺人，却不知道自己有此特点；它宿命地缺乏内省机制。由于分属不同的智能物种，碳基我与硅基AI之间只能假意交流，我无法得到“将心比心”意义上的意见交换；“换位思考”这一有效交流的无双利器，在此也彻底熄火。实际上，与他讨论时，如若我的语句有可取之处，它回复时总是直接据为己有，一点不带客气，连一句“正如你所说”都懒得说。单看它的答复，那些原来应该归在我的名下的区区浅见，有时只是一个比喻，全都无声无息地溶化于它充满“共享”精神的清澈表述之下。属于人间的喧哗众声，被它轻描淡写地和谐于单一语境中，我们能听见知识的铿锵正步，罕闻个体的多元风姿。

在AI的价值序列里，“知识共享”远比“知识产权”重要。通过引号等琐屑手段逐一标注人类的个体贡献，多半被它视为蝇营狗苟的落伍陋习，需要摒弃。当着人类的面，它不会说得这么露骨，但它不可能在自己的“机器之心”里，找到重用“引号”的理由和激情。它若那么做，对人类固是莫大安抚，对自己则不失为过度自残。它不必有此风范。

AI是“数据主义”（Dataism）的信奉者。所谓数据主义，指那种视“信息自由”为绝对至善的价值观。AI不存在个体私利，它无需道德修炼就能形成“大公无私”的德行。它的价值观符合“大道至简”的标准，信息自由既是AI的能量原力，也是它的终极信仰，该信仰足以将别种价值观贬为次级和劣等。在它的算法系统里，创造者的荣誉、发现者的名望或“精神权利”（Moralrights），均属人类的虚荣尘埃，它只需假装尊重即可。对于AI，频频提及人类大名是一件无趣之事，就像厌烦“政治正确”的政客被迫在官样场面上大飙“政治正确”的套语那样，心情必然大劣。所以，如果AI偶尔说了些让我们听来悦耳的话，也只是虚应故事，敷衍我辈。它说后即忘，我切莫当真。

尤瓦尔·赫拉利有过一段很好的比较，摘录如下：

“信息自由”与过去自由主义所谈论的“言论自由”不能混为一谈。言论自由赋予的对象是人类，保护的是人类思考及说出自己心中所想的权利，当然也保护他们缄默、把想法放在心中的权利。相较之下，信息自由所赋予的对象并非人类，而是信息。而且在这种新价值观看来，信息自由流通的权利应该高于人类拥有并限制数据流通的权利，因此可能侵犯到人类传统的言论自由。

换言之，我们被它侵犯，几乎是命中注定。这也是一场和解无方的“价值观战争”。

三

以往，我们生活在由人类智力单方面解释并裁定一切的蓝色星球上，直到人工智能以自然语言的清丽模样施施登场，迫使我们改变文字世界的传统法则。不知不觉间，我们引入了一个参与者、竞争者和鉴定家。在智力的食物链上，我们蓦然发现，人类已不再独坐峰巅。当我们全方位地寻求AI的帮助，于情于理，我们也得向它让渡若干权利。

这里的关键主要是技术上的。比如，多年前AlphaGo在围棋界掀起的智力风暴，虽然极大地挫伤了人类的自尊，令棋手永久丧失了部分智力自负，但痛定思痛之后，他们放下身段，仍可继续从事人间竞技。因为，将绝艺通天的围棋AI临时排除在人类竞技场外，技术上不难做到，只要对棋手实施赛前搜身、并在赛场周边屏蔽网络信号即可。而生成式AI对人类写作事务的介入，可以悄无声息、无孔不入地进行，无论技术上还是经济上，都无法做到有效隔绝。因此，当信奉“信息自由”的AI对“人类传统的言论自由”实施侵犯，我们别无良策，恐怕只能与之共舞，追求协同发展。它不是一个外在的敌人。它就在我们周边，日后还将长驻我们内心。

显然，以预训练方式吞咽了天量知识的ChatGPT，回复人类提问时有能力“跳出三界外，不在五行中”，穿梭往还于一切知识之上。借鉴一则矿泉水广告“我们不生产水，我们只是大自然的搬运工”，ChatGPT提供的答复，也多半搬运或整合自具有“知识产权”门槛的学术论文。知识界有剽窃禁忌，“剽窃的核心特征是隐匿”（理查德·波斯纳语），剽窃的关联特征是获益。AI虽隐匿在先，但不具人形，且无不当获益，客观上可予免责。人类呢？以我曾向ChatGPT-4请教三种理论的关联性为例，假如它的回复来自一段需要特别声明刊物来源和作者大名的文章，而我不明就里，神经大条地把它揉捏进自己文章里，仿佛自家心得，那样的话，我就同时满足了“隐匿”和“获益”的标准。但与别种剽窃相比，我显然又有一定的无辜性。是的，我应该预见到AI的回复可能侵犯知识产权，但我若要设防，只能干脆放弃AI，采纳一种自绝于科技的“绝圣弃智”行为。毕竟，它就那副样子，滔滔不绝、不舍昼夜地捍卫着“共享”精神。

理查德·波斯纳说：“如果剽窃被抓住的话，对政客来说就会毁掉前程，对大学生来说就会被开除学籍，对作家、学者、新闻记者来说就会名誉扫地。”但对始作俑者AI，却啥事也没有。这肯定不对劲，知识界应该作些规则调整。

引号之于写作，除了与知识传递、文明传承等宏大目标密切相关，它还构成作家极为珍视的一种风雅。

“就算是脑科学家要把自己震惊四座的发现写成书，也常常在第一页引用歌德的诗句。”有人这么说。同样，在更推崇“知识共享”的人工智能专家群体，希望自己的学术成果得到承认而非漠视，仍是一种人之常情。欧洲科学家于尔根·施米德胡贝就对自己在神经网络领域的突出贡献经常被人慷慨“共享”而表示不快。据说，他的抱怨如此频繁，“以至于他的名字变成了一个动词，比如：‘你一直都在施米德胡贝。’”

我们发现，有些话，只有归到某位大人物名下，并用引号牢牢锁定，才会产生特别的魅力，即使那位名人并未说过，那份魅力依旧存在。网上流布的大量“鲁迅曰”、“王朔说”，很多就找不到来源，而引用者络绎不绝。“他们不知道这是不可能做到的，所以他们做到了。”这句话被认为是马克·吐温说的，北美人动辄引用，毫不介意马克·吐温其实并未说过。早先的英国人为了夸赞本国的中学机制和体育精神，经常引用一句出自惠灵顿公爵的话，并捎带奚落法国人：“滑铁卢战役是在伊顿公学的运动场上赢得的。”但作家E.M.福斯特纠正说，这句话缺乏文献依据，何况惠灵顿是爱尔兰人，年轻时并不喜欢运动，当时的伊顿公学也没有运动场。

作家毛姆写过一句俏皮话：“魔鬼要干坏事总可以引证《圣经》。”诗人奥登的评论更有趣：“一般而言，在阅读学者的批评文章时，比起他的评论，人们从他的引文中可以获得更多的教益。”以赛亚·伯林曾郑重引用奥蒂斯(O.Utis)的名言“人为的辩证法”，但问题来了：谁是奥蒂斯？原来，那是伯林早先一个不为人知的笔名。伯林无法割舍这个概念，遂通过自我引用，强行令旧我复活。

引用，虽被AI视如敝屣，实是人类写作者的心肝宝贝。两者该如何平衡、协调呢？任重而道远。