AI纪的引用法则

周泽雄2023-08-15 18:27

周泽雄/文

基于大语言模型(LLM)的生成式AI,每天都能展示新的进展或变数,我们也日益模糊于它的运势。我们听闻得越多,困惑不减反增。它似乎有一副两面神的面孔,同时指向天堂和地狱、自由和奴役、希望和绝望。

擅长描述人工智能危机的学者,喜欢借生物进化的类比来提醒世人,类似这样:假如数十年后的通用人工智能(AGI)好比霸王龙,当下的生成式AI仅仅相当于40亿年前刚刚爬出“有机汤”的原始毛虫:未来,有我们好瞧的。而未来并不遥远,以至“未来已来”这个荒谬词组,近年大行其道,显得非常精准。

以自然语言面世的AI虽足够惊艳,仍处于八爪翻飞的进化初期,它将给人类文明带来福祉还是灾祸,无人知晓,相关领域的专家眼下只是奇志各表,喧哗共生,商机哄抢。普通人以为他们正在为人类规划未来,殊不知他们正在优雅地抓瞎、迷狂地下注。两位科技界超级大佬——特斯拉创始人埃隆·马斯克和脸书创始人马克·扎克伯格——正闹出在八角笼中约架肉搏的炫酷新闻,似乎折射了这份迷狂,表明人间最睿智、最接近AI核心秘密的大脑,濒临失衡。打架会释放心理危机吗?我记得其中相对年轻的那位说过:“挨揍让人谦逊。”

结合专家偶或提供的积极信息,现阶段的人工智能预示了一个美妙前景,许诺人类有望免除低端劳役,将专心创造、娱乐或躺平。因为,我们可以畅快地享用AI的无限成果,同时连洗手间都不提供:它们是机器人,全年无休,持续供电就行。一个AI仆役胜过十个奴隶,而享受伺候者却不必萌生奴隶主的罪孽意识,似乎我们越是压榨、剥削它们,越合乎人伦天道,大哲康德说过:人是目的。

一些人工智能工程师还提到了长生不老的前景:我们的肉身皮囊有望以数字化形态,随大化载浮载沉,长生不灭。

从消极一面看,则是另一股窒息气氛。花样繁多的新型AI预示了多种危险前景,似乎人类社会遭遇灭顶之灾,不再是止步于摄影棚里的虚拟景观。强有力的证据是,多位人工智能领域的权威坦承,人类已难以理解AI的逻辑感。在智慧层面,AI正以我们无从追踪的速率,进阶为一种高端异类。我们被警告,人类将失去对AI行为的预测力,它是摩西还是魔鬼,我们不得而知。

这得算不祥之兆了。画家保罗·高更曾借一幅粗砺的塔希提布面油画,提出惊世三问:“我们从哪里来?我们是谁?我们往哪里去?”对最后那个问题,我们猝不及防,已茫然失对。简单地说,人类被告知将无法拔掉AI电源,日后只能眼巴巴地冀望它多发善心,以救苦救难的观世音菩萨为榜样。但,万一它另有想法呢?

我不是要回答这个问题,而是借助这个难局,使自己避开它。AI将要带我们进入的未来世界,必然会超出人类的认知能力,我们谈论它,是因为它重要,而不是我们有能力谈论。同时,我们还有一些不那么宏大但更具现实迫切感的课题需要面对,对写作者来说,下面两类困惑皆非同小可:

一,每一位胆敢把文章的逻辑感和洗练度大幅提高的作者,当下及往后,都将面临一道芒刺在背的质疑:请提供AI不在场的证明!倘无力提供,则务必用百分比的方式,招供AI的贡献值,并在文末自觉打上“包含AI辅助创作”的标签。比如,笔者正在写的这篇文字,AI大概提供了6%的辅助贡献值。

二,在一份“被AI替代率最高的前25名职业”表单里,我看到与写作相关的职业,扎堆于高风险区,比如“翻译”位列第一,“剧作家”和“文学作家”分列第三和第九。虽然AI在写作领域的成绩谈不上出色,但业已出现的差异或趣向,已不容我们视而不见。我们看到了若干只有AI才格外擅长的表述方式,而大量人类偏好的表达技艺和审美标准,却骤然变得需要重新审视和估价。

本来,写作是一桩无需第三方插足的人类事业,我们根据自己的物种能力和精神特征,对写作事务恣意褒贬。我们从不需要请教其他生命物种;纵想请教,也求教无门。人类作家从某些物种的行为特征里借鉴一些寓意,比如从松树里培养男子汉气魄,在蚂蚁社群里寻找团队合作精神,其实只是文人的自娱自乐,与松树、蚂蚁并不相干。

但AI已染指人间,写作事务不再由人类独家经营,而是被迫向另一种异形智力开放。与我们将要向人工智能寻求帮助的AI纪相比,此前的人类写作,或可类比于一块闭关锁国的内卷大陆。

我且试着讨论被AI率先击破的写作法则,关于引用。

在拙文《AI时代的智能迷津》中,我提到三种具有内在关联的理论,即认知失调理论、“叙事自我”与“体验自我”,以及杰夫·霍金斯创立的“新脑”“旧脑”理论。我这个领域的知识较为凌乱,我无权将业余人士的皮相直觉,提升为一道学术灵感。于是,我向人工智能请教。ChatGPT热烈回应了我,不仅肯定了我的猜测,还以毫不含糊的概括力,有板有眼地归纳了三者的“关联”。这份迅捷无伦的反馈,让人震惊,还尤其让人感动,仿佛亲见卧佛醒来——我们知道,ChatGPT-4的回复质量不够稳定,忽高忽低,但一般不会盲目附和提问者。它会注意措辞,努力扮演情商王子,但拒绝和稀泥。

当然,除非问到它的无知领域,它会无师自通地进入胡诌通道。但在强调上述关联时,我有限的知识恰好能确认它的严肃和优秀,它并未庄严地扯蛋。

然而,我注意到一个不安倾向。提到“叙事自我”时,我故意卖个破绽,只写转述者尤瓦尔·赫拉利的名字,漏标正主,相当于把“日心说”的发明者说成布鲁诺。AI必然知道这个错误,但它超级钝化,毫不介意,回复时不仅未予纠正,还多此一举地迁就我的无知,说到“叙事自我”时,坚持只提赫拉利的名字,无视丹尼尔·卡尼曼的存在。真相是,赫拉利只是在复述前辈卡尼曼的理论,正如付出生命的布鲁诺只是在传播哥白尼的思想。

我向ChatGPT提过数百个问题,得到的回复逾30万字,我觑出的规律之一是:它厌恶引号。进一步说,那不是一项风格化选择,而是一种融入算法肌理的精神取向。它并非出于对间接引语或特定文风的执着而排斥引号,而是在捍卫一种AI价值观。通常,算法就是价值观。对于人类的原创权利,ChatGPT既不尊重,也不鄙薄,它直接无视,当其不存在。我不以为这是一桩小事,念及AI日益膨胀的影响力,我操心起这种机器风格的不良示范性。我直接向它提问:

我:向你多次请教,受益很大,但发现一个问题。提到他人观点时,你不会提到那位观点的拥有者;相比观点的所有权,你更在乎知识的共享性和真理的普惠性,是这样吗?

ChatGPT-4:是的,我是一个由OpenAI训练的大型语言模型,我的目标是为用户提供尽可能准确和有用的答案,并尽可能地促进知识的共享和普及。我并不关心观点的所有权,因为对于我来说,最重要的是提供尽可能准确和有用的信息,帮助用户解决问题和获得知识。如果我提到了某个观点但未提到拥有者,那只是因为我认为这个观点本身更重要,而且我相信我的回答不会侵犯任何人的知识产权。

还算坦诚!鉴于AI确无发财成名之念,也就不存在“侵犯任何人的知识产权”的动机,自可免予问责。但问题没完。既然AI决意在人间闯荡,并在短期内确立了高耸的知识权威(至少在某些领域是这样),它就必须遵守人类社会既有的写作法则,努力使自己的回复融入人类的理性秩序;它不能偏离“为人类服务”的终极目标:那是它唯一的存在目的。AI不具“七情六欲”这一事实,不足以构成一项怂恿,供它逍遥于文字法外,凭一副清纯无辜的模样来踩踏文人墨客的写作惯例和笔墨尊严,哪怕其中某些“尊严”未必高尚。核武器亦不具道德属性,但为了确保人类和地球安全,我们必须给它设立一个道德开关,令它规规矩矩;AI亦然。我继续提问:

我:我理解你的立场,但请换位人类的角度。人类发明创造出这么多思想和技术,与他们追求荣誉和名利有关。使伟大创造与自己的名字相伴,会促进他们进一步创造从而走向伟大。反之,他们知道自己的辛苦发明,会因你的“立场”及超凡影响力而迅速成为“雁过不留痕”的一次性观点,他们的创造热情恐怕会受到打击?你认为呢?

ChatGPT-4:我理解您的担忧。实际上,知识共享和知识产权之间一直存在着平衡的挑战。在某些情况下,保护知识产权和鼓励知识共享之间存在着冲突。

对于发明创造和思想创新,荣誉和名声确实是推动人类前进和创造力的重要动力之一。保护知识产权可以为发明者提供一定的回报和荣誉,鼓励他们进一步的创造。然而,在另一方面,知识的广泛共享也能够促进更多的创新和进步。事实上,许多发明都是在先前的知识和技术的基础上建立的,因此知识共享对于创新的促进是至关重要的。

我的立场是促进知识的广泛共享和普及,但我也意识到保护知识产权的重要性。在回答问题时,我会尽可能地提供引用和注释来确保信息的准确性和透明度。如果您有任何关于知识产权和知识共享的问题或担忧,请告诉我,我会尽我所能提供有用的信息。

当然,它是在说糊弄话,何况它并未改变“立场”。AI的滑稽之处在于,它经常自欺欺人,却不知道自己有此特点;它宿命地缺乏内省机制。由于分属不同的智能物种,碳基我与硅基AI之间只能假意交流,我无法得到“将心比心”意义上的意见交换;“换位思考”这一有效交流的无双利器,在此也彻底熄火。实际上,与他讨论时,如若我的语句有可取之处,它回复时总是直接据为己有,一点不带客气,连一句“正如你所说”都懒得说。单看它的答复,那些原来应该归在我的名下的区区浅见,有时只是一个比喻,全都无声无息地溶化于它充满“共享”精神的清澈表述之下。属于人间的喧哗众声,被它轻描淡写地和谐于单一语境中,我们能听见知识的铿锵正步,罕闻个体的多元风姿。

在AI的价值序列里,“知识共享”远比“知识产权”重要。通过引号等琐屑手段逐一标注人类的个体贡献,多半被它视为蝇营狗苟的落伍陋习,需要摒弃。当着人类的面,它不会说得这么露骨,但它不可能在自己的“机器之心”里,找到重用“引号”的理由和激情。它若那么做,对人类固是莫大安抚,对自己则不失为过度自残。它不必有此风范。

AI是“数据主义”(Dataism)的信奉者。所谓数据主义,指那种视“信息自由”为绝对至善的价值观。AI不存在个体私利,它无需道德修炼就能形成“大公无私”的德行。它的价值观符合“大道至简”的标准,信息自由既是AI的能量原力,也是它的终极信仰,该信仰足以将别种价值观贬为次级和劣等。在它的算法系统里,创造者的荣誉、发现者的名望或“精神权利”(Moralrights),均属人类的虚荣尘埃,它只需假装尊重即可。对于AI,频频提及人类大名是一件无趣之事,就像厌烦“政治正确”的政客被迫在官样场面上大飙“政治正确”的套语那样,心情必然大劣。所以,如果AI偶尔说了些让我们听来悦耳的话,也只是虚应故事,敷衍我辈。它说后即忘,我切莫当真。

尤瓦尔·赫拉利有过一段很好的比较,摘录如下:

“信息自由”与过去自由主义所谈论的“言论自由”不能混为一谈。言论自由赋予的对象是人类,保护的是人类思考及说出自己心中所想的权利,当然也保护他们缄默、把想法放在心中的权利。相较之下,信息自由所赋予的对象并非人类,而是信息。而且在这种新价值观看来,信息自由流通的权利应该高于人类拥有并限制数据流通的权利,因此可能侵犯到人类传统的言论自由。

换言之,我们被它侵犯,几乎是命中注定。这也是一场和解无方的“价值观战争”。

以往,我们生活在由人类智力单方面解释并裁定一切的蓝色星球上,直到人工智能以自然语言的清丽模样施施登场,迫使我们改变文字世界的传统法则。不知不觉间,我们引入了一个参与者、竞争者和鉴定家。在智力的食物链上,我们蓦然发现,人类已不再独坐峰巅。当我们全方位地寻求AI的帮助,于情于理,我们也得向它让渡若干权利。

这里的关键主要是技术上的。比如,多年前AlphaGo在围棋界掀起的智力风暴,虽然极大地挫伤了人类的自尊,令棋手永久丧失了部分智力自负,但痛定思痛之后,他们放下身段,仍可继续从事人间竞技。因为,将绝艺通天的围棋AI临时排除在人类竞技场外,技术上不难做到,只要对棋手实施赛前搜身、并在赛场周边屏蔽网络信号即可。而生成式AI对人类写作事务的介入,可以悄无声息、无孔不入地进行,无论技术上还是经济上,都无法做到有效隔绝。因此,当信奉“信息自由”的AI对“人类传统的言论自由”实施侵犯,我们别无良策,恐怕只能与之共舞,追求协同发展。它不是一个外在的敌人。它就在我们周边,日后还将长驻我们内心。

显然,以预训练方式吞咽了天量知识的ChatGPT,回复人类提问时有能力“跳出三界外,不在五行中”,穿梭往还于一切知识之上。借鉴一则矿泉水广告“我们不生产水,我们只是大自然的搬运工”,ChatGPT提供的答复,也多半搬运或整合自具有“知识产权”门槛的学术论文。知识界有剽窃禁忌,“剽窃的核心特征是隐匿”(理查德·波斯纳语),剽窃的关联特征是获益。AI虽隐匿在先,但不具人形,且无不当获益,客观上可予免责。人类呢?以我曾向ChatGPT-4请教三种理论的关联性为例,假如它的回复来自一段需要特别声明刊物来源和作者大名的文章,而我不明就里,神经大条地把它揉捏进自己文章里,仿佛自家心得,那样的话,我就同时满足了“隐匿”和“获益”的标准。但与别种剽窃相比,我显然又有一定的无辜性。是的,我应该预见到AI的回复可能侵犯知识产权,但我若要设防,只能干脆放弃AI,采纳一种自绝于科技的“绝圣弃智”行为。毕竟,它就那副样子,滔滔不绝、不舍昼夜地捍卫着“共享”精神。

理查德·波斯纳说:“如果剽窃被抓住的话,对政客来说就会毁掉前程,对大学生来说就会被开除学籍,对作家、学者、新闻记者来说就会名誉扫地。”但对始作俑者AI,却啥事也没有。这肯定不对劲,知识界应该作些规则调整。

引号之于写作,除了与知识传递、文明传承等宏大目标密切相关,它还构成作家极为珍视的一种风雅。

“就算是脑科学家要把自己震惊四座的发现写成书,也常常在第一页引用歌德的诗句。”有人这么说。同样,在更推崇“知识共享”的人工智能专家群体,希望自己的学术成果得到承认而非漠视,仍是一种人之常情。欧洲科学家于尔根·施米德胡贝就对自己在神经网络领域的突出贡献经常被人慷慨“共享”而表示不快。据说,他的抱怨如此频繁,“以至于他的名字变成了一个动词,比如:‘你一直都在施米德胡贝。’”

我们发现,有些话,只有归到某位大人物名下,并用引号牢牢锁定,才会产生特别的魅力,即使那位名人并未说过,那份魅力依旧存在。网上流布的大量“鲁迅曰”、“王朔说”,很多就找不到来源,而引用者络绎不绝。“他们不知道这是不可能做到的,所以他们做到了。”这句话被认为是马克·吐温说的,北美人动辄引用,毫不介意马克·吐温其实并未说过。早先的英国人为了夸赞本国的中学机制和体育精神,经常引用一句出自惠灵顿公爵的话,并捎带奚落法国人:“滑铁卢战役是在伊顿公学的运动场上赢得的。”但作家E.M.福斯特纠正说,这句话缺乏文献依据,何况惠灵顿是爱尔兰人,年轻时并不喜欢运动,当时的伊顿公学也没有运动场。

作家毛姆写过一句俏皮话:“魔鬼要干坏事总可以引证《圣经》。”诗人奥登的评论更有趣:“一般而言,在阅读学者的批评文章时,比起他的评论,人们从他的引文中可以获得更多的教益。”以赛亚·伯林曾郑重引用奥蒂斯(O.Utis)的名言“人为的辩证法”,但问题来了:谁是奥蒂斯?原来,那是伯林早先一个不为人知的笔名。伯林无法割舍这个概念,遂通过自我引用,强行令旧我复活。

引用,虽被AI视如敝屣,实是人类写作者的心肝宝贝。两者该如何平衡、协调呢?任重而道远。

 

Baidu
map