隐私保护问题的经济学思考

陈永伟2020-11-09 13:12

(图片来源:东方ic)

【超级平台】

陈永伟/文

前几天，上海社科院举办了一个关于《个人信息保护法》(草案)的研讨会。主办方也给我发了邀请，让我去谈一下和隐私保护相关的话题。坦白说，在收到邀请时，我是很犹豫的。虽然我也写过几篇关于数据、隐私方面的论文，但都是经济学方面的，关于法律还是不太敢妄议。后来，主办方和我说就谈经济学，我才诚惶诚恐地接受了邀请。

为了不至于让发言太外行，我找了很多文献来读，结果关于“隐私”这个概念就纠结了半天。在看了无数关于“隐私”的定义，做成几页PPT之后，最后留在我心中的只有学者齐默尔曼（Di－aneZimmerman）在《耶鲁法学杂志》（Yale Law Journal）说的一句话：“隐私概念真是像九头蛇（Hydra）的头一样，多到数不清”。

几经周折，花费了几天工夫，终于作了一个名叫《隐私的经济学分析》的演讲。令我欣喜的是，在我作完了这个演讲后，十分意外地收获了好评。在座的不少资深法学家都说这个演讲给他们提供了一个新的视角，打开了很多不同的思路。其中的几位专家还鼓励我把这个报告写出来，给他们作为参考。既然如此，我就勉为其难，将这些并不算成熟的想法写成一个专栏，权当交一个阶段性的作业吧！

隐私的经济学分析：一段小史

在开始介绍经济学家对隐私的分析前，我需要先澄清两个概念：“隐私”和个人信息。这两个概念在不同国家的定义不同。有些国家，如美国等秉持“一元论”，认为两个概念是等价的；而另一些国家则持“二元论”，对两个概念做了更精细的划分。由于关于隐私的经济学分析主要源于美国，因此在本文中，我们就暂且采用“一元论”的观点，不再多加区分。

美国卡耐基梅隆大学的教授亚历山德罗·阿奎斯蒂（AlessandroAc－quisti）曾在一篇综述性的论文中把经济学家对隐私的分析分为三个阶段：第一阶段是上世纪六七十年代，第二阶段是上世纪九十年代，而第三阶段则是进入二十一世纪之后。阿奎斯蒂在分类时，综合考虑了议题和研究方法的区别，但事实上如果只看议题，那么后面两个阶段在很大程度上可以直接合并在一起，只不过从技术上看，九十年代的研究偏重于文字性的讨论，而新世纪之后的研究则更多地利用数理模型和计量经济学的分析。为了方便起见，下面我就将这两个阶段合在一起进行介绍。

先看第一阶段。从讨论的话题上看，这个阶段关于隐私的讨论主要是集中在劳动和用工方面。而从思想源流上看，这个阶段的讨论则主要是芝加哥学派的支持者和反对者之间的争论。这在很大程度上反应了时代的特点。在上世纪七十年代，关于政府究竟应该加强管制还是放松管制的争论十分激烈，而劳动力市场就是政府管制的一个主要目标，因此关于劳动力市场的相关政策也就成了持两派观点的经济学家竞相关注的焦点。当时，美国政府为了防止劳动力市场上的歧视，曾讨论和出台过不少相关措施，限制用工单位对求职者的个人信息进行过多调查。显然，从经济学角度看，这就是对于劳动力市场的一项管制。

从总体上看，芝加哥学派在经济政策上是主张放松管制、回归自由放任的，因此在他们的眼中，作为劳动力市场管制的隐私保护政策只会扭曲市场的运作，因而是不应该提倡的。

在持有类似观点的学者中，最有名的就是具有传奇色彩的理查德·波斯纳（RichardPosner）。在法律经济学领域，提起波斯纳可谓是无人不知，他不仅长期担任美国联邦上诉法院法官，审理过很多著名的案件，还著作等身，出版过几十部专著，发表过上百篇学术论文，其著作《法律的经济分析》至今依然是法律经济学领域最重要的经典。

从1978年开始，波斯纳就先后发表了一系列的论文讨论了隐私保护的影响，对于严格保护隐私的观念提出了十分犀利的批判。总的来说，波斯纳对隐私保护的反对主要有两个层面：

第一个层面是效率上的。波斯纳指出，市场经济的效率在很大程度上是建立在信息公开、对称的基础之上，只有当市场上的人都知道彼此的信息，才能有效地进行交易，实现人尽其才、物尽其用的配置。而从本质上看，保护隐私、限制对个人信息的搜集和披露就是对信息的隐藏，这不仅在法律角度上是侵犯他人知情权的，在经济上也是无效率的。由于每个人都不知道自己交易对象的客观信息，因此资源就可能因此而造成严重的错配，从而造成对效率的严重损害。

波斯纳的第二个层面则是建立在公平基础之上的。在很多主张隐私保护的人看来，之所以保护隐私，是害怕人们的某些信息被公之于众之后会遭受到相应的歧视。例如，在求职过程中，一些人可能患有某些疾病，这些疾病虽然不会影响他们对工作的胜任，但在多数时候却会让他们在竞聘的过程中处于劣势。对于这个观点，波斯纳提出了激烈的反对。他指出，虽然限制搜集隐私可以避免针对个人的歧视，但这却会带来另一个后果，即“统计歧视”的增加。顾名思义，所谓“统计歧视”指的就是基于某些统计特征的歧视。比如针对某些地区人的“地图炮”，或者针对某些专门职业的“职业炮”，都是统计歧视的体现。

为什么波斯纳说限制搜集隐私会导致统计歧视的增加呢？其实我们看一下不久前的抗疫情况就不难明白。在“健康码”推出之前，很多地方对于疫情的控制采用的主要是“一刀切”的办法，对于到过疫区的人，甚至持有疫区身份证的人都严加管制，甚至谢绝进入。有很多学者对此进行了批评，但其实在当时，这些地方的政府也是出于无奈，因为他们无法精确地知道每个人的确切信息，只能退而求其次，以一种比较粗的标准来进行管控。而“健康码”推出之后，情况就变了。在被允许采集更多的个人信息之后，政府就可以根据个人的具体状况实施精准防控。同样的道理，在波斯纳看来，劳动力市场上最大的歧视其实并不是对个人能力的歧视，而是统计歧视。基于这点，他主张放开对于隐私搜集的限制，从而尽可能地消除统计歧视。

对隐私保护提出批评的另一位重要学者是芝加哥学派的代表人物，按江湖辈份应该算是波斯纳老师的乔治·斯蒂格勒（GeorgeStigler）。斯蒂格勒从一个更为理论化的角度来分析了隐私保护问题。在他看来，隐私保护完全是私人事件，政府介入隐私保护完全是多此一举。当没有政府的干预时，个人会基于自己的成本-收益来分析究竟披露自己的哪些信息；而企业也会根据自身的成本-收益来考虑到底搜集哪些信息。在个人和企业的分别理性计算之下，整个市场的运作将会是有效率的，政府的介入只会干扰这一切。比如，当政府限制企业搜集数据之后，个人为了能在求职时展现自己的才华和资质，就必须去进行一些无效率的投资，而这是会造成浪费的。

后来，有一些经济学家对斯蒂格勒的思想进行了一个阐发。比如诺贝尔奖得主迈克尔·斯宾塞（MichaelSpence）就提出过一个“信号传递”（Signaling）模型。在这个模型中，受教育并不能带来生产率的提升，但有能力的人为了证明自己，就会去接受过度教育。由于斯宾塞的举例过度荒谬，以至于不少好事之人甚至经常把它拿来用作“知识无用论”的证据，但不可否认，它背后的逻辑是深刻的——如果有些信息无法被直接获取，人们就不得不采用更为无效率的手段来传送它。显然，在斯蒂格勒等人看来，与其这样，倒还不如就从一开始准许了对这些信息的传达。

必须承认，芝加哥学派的观点是十分具有冲击性的。不过，在七十年代的论战中，反对芝加哥学派隐私观的观点也同样有力。

对芝加哥学派的隐私观提出质疑的第一位重要人物是加州大学洛杉矶分校的教授杰克·赫舒拉发(JackHirsh－leifer)。相比于斯蒂格勒和波斯纳，赫舒拉发在学界的名声可能要小一些，但在中国，他的知名度可能要远高于美国，因为他有一个著名的学生叫张五常，每次演讲都会把他提一遍。不过，赫舒拉发在经济学上的套路其实和张五常很不一样，他论证经济问题主要是依靠数学模型，而不是文字。对于斯蒂格勒等人的观点，赫舒拉发用一个严格的数学模型给出了反驳。这个模型很复杂，但经济逻辑是相对直接的：确实，如斯蒂格勒和波斯纳所言，人们在劳动力市场上希望披露一些自己的信息，因此在一定程度上，放松隐私保护可以获得一定的收益。但与此同时，人们也不愿意自己的另一些信息被别人知道。在这种条件下，如果隐私保护政策很宽松，人们为了防止自己的信息泄露，就不得不自行投入成本，而这种投入可能是巨大而无效率的。在模型中，赫舒拉发把隐私保护的成本和收益进行了权衡，发现隐私保护的收益远远高于其成本。据此，他认为隐私保护是应该值得提倡的。

沿着赫舒拉发的思想，很多学者进一步进行了阐发。他们认为，如果没有严格的隐私保护政策，人们可能会惧怕自己的隐私暴露而不去做一些对自己、对社会有利的事。比如，如果某人怀疑自己患有某些传染病，那么无论是从个人还是从社会的角度看，去医院就诊都是最优的。但是，如果顾虑到自己的信息可能被暴露，从而对自己的生活带来麻烦，他就可能会放弃就诊。显然，这对于他自己和社会都是很不利的。

再看第二个阶段，也就是上世纪九十年代之后经济学家对于隐私的分析。从九十年代开始，计算机和互联网逐步进入了人们的生产生活，数字化趋势开始逐渐呈现。随着数字化时代的到来，数据开始成为了一种关键的生产要素，因此在这个时代的隐私讨论也就很自然地和网络上的数据搜集，以及数据产权的划分等结合到了一起。

这个阶段，在隐私问题上最为重要的经济学家当推哈尔·范里安（HalVarian）。范里安担任过加州大学伯克利分校的教授、谷歌的首席经济学家，他和夏皮罗一起合著的《信息规则》是数字经济领域的经典，而其撰写的两本教科书《中级微观经济学》和《微观经济分析》则更是分别占据本科和研究生的微观经济学教科书市场很多年。从九十年代中期开始，范里安就曾经对隐私和个人数据问题进行过很多分析。相比于学界前辈，他的分析是比较中性的，对于隐私保护的收益和成本都有涉及。

一方面，范里安向人们强调了所谓的“隐私成本”。在他看来，隐私保护的一个重要成本是它阻碍了某些新商业模式的运作。在现实中，尤其是数字经济环境之下，很多的商业模式都是数据驱动的。例如定向广告、定向推荐，这些都需要首先对用户的数据有比较精确的了解。显然，如果隐私保护过于严格，就会大幅增加数据搜集和使用的成本，进而会让这些商业模式难以开展，消费者福利也会因此而下降。在范里安看来，让原来可能的商业模式变得不可能，就是严格的隐私保护所带来的最大成本。

另一方面，范里安也向人们展示了放松隐私保护政策所可能造成的成本。在这个过程中，他尤其强调了数据二次传播带来的可能影响。对于一般的商品，我们在将其出让后，是很容易限制其二次传播的。比如，甲把一样东西卖给了乙，他要检验这样东西是不是被转让了，只要让甲把东西出示给他一下就行。但数据这东西就很不一样，它可以复制，有非排他性，因此我们一旦允许别人搜集我们的隐私信息，就很难再限制它的传播。如果这些信息可以被无限制传播，那么其潜在风险就是不可控的。关于这一点，我们在现实中已经看到了很多案例。显然，如果对于隐私保护的措施更严，那么这些风险将可以被有效地避免。

除了从成本收益角度对隐私保护的利弊进行分析之外，另一支重要的文献是从产权角度来考虑隐私保护问题。我们知道，在产权经济学上，有一个著名的“科斯定理”，说的是：如果市场上的交易成本很低，那么产权的初始划分就是不重要的，经济中的人通过自由谈判就可以让资源得到最有效的配置。相反，如果交易成本很高，那么在事先把产权分配给对资源估价更高的一方将可以有效提高资源配置效率。在隐私问题的讨论中，如果我们把“是否保护隐私”作为一种产权——那严格保护，就意味着产权在信息被搜集者那里，而放开保护，就意味着产权在搜集者那里，然后我们就可以用“科斯定理”来分析了。这支文献中，比较有代表性的是卡恩、麦克安德鲁斯和罗伯茨这三位学者在2000年发表的一篇论文。他们认为，在现实中，数据的交易成本是很高的，因此就有必要对隐私保护的初始产权进行一个分配，以此来诱导数据资源的有效配置。值得注意的是，三位作者专门强调了产业发展阶段的影响。例如，在互联网发展的早期，让互联网企业迅速成长是最为重要的，这时将“隐私产权”配置给它们就比较符合效率；而当互联网企业发展到一个比较高的阶段后，消费者对于隐私的重视程度可能超过了出让个人信息给他们带来的好处，这个时候把更多的“隐私产权”配置给消费者，采用较为严格的隐私保护政策可能就显得比较合适了。

隐私经济学的启示：一些思考

花费了上面这些篇幅，回顾了一大堆经济学家关于隐私保护的观点，感觉好像是莫衷一是，不能给出任何结论。是的，经济学家永远都不会达成一致，甚至有人讽刺说“十个经济学家在一起，可以提出十一种不同观点”，但这并不意味着他们说的没有价值。事实上，正是这些相互冲突的观点，让我们得以清楚地知道在什么样的情况下更多保护隐私是好的，在什么情况下则是相反。在相关法律制定的过程中，会强调利益平衡。但到底隐私保护政策的变化会引起哪些主体之间的利益变化，怎样变化，变化大小有多少，法律本身并不能给出回答。这时，经济学的结论就可以为法学家们提出一个比较好的参考。

沿着这一思路，我个人认为，通过以上的分析，我们至少可以得出以上的结论：

其一，隐私保护并不是越严格越好，而是要根据实际情况，在尊重个人隐私与促进经济的发展之间寻找一个最优的平衡。自从欧盟出台了《通用数据保护条例》（GeneralDataProtectionRegulation），也就是著名的GDPR之后，有不少国内的学者也主张应该效防欧盟，出台一部严格的法律来保障隐私和个人数据。对于这种观点在法律层面是否站得住脚，我无权评论，但从经济角度看，像GDPR中那么严格的数据保护或许是不太符合我国的现实的。事实上，在GDPR颁布后，有不少学者都对其经济影响进行了实证分析，结果发现它有可能带来投资下降、新技术（如云计算）发展缓慢、生产率下降等一系列负面的后果。我想，在中国这样一个数字经济远比欧洲发达的国家，这些效应可能会更加明显。这些后果都是有经济成本的，在制定法律时绝不应该忽视。

其二，在制定隐私保护相关的法律和政策时，不应该一刀切，而应该对产业的特性，以及其发展阶段有所考虑。总的来说，如果在一个行业中，数据扮演更为重要的角色，可以带来更大的价值，那么就应该对这个产业的个人数据搜集采取一个相对宽松的态度；反之，则可以采取一个更紧的态度。此外，在一个数据驱动的产业的发展早期，应该考虑给予相对宽松的政策，而到了这个产业发展比较成熟后，则可以引导这个产业更加重视对隐私和个人数据的保护，让用户获得更多看得见的好处。

其三，在给定其他情况不变时，如果防止信息泄露的技术有所提升，则相应的对于个人数据搜集和利用的限制应该予以放松。正如范里安所指出的，宽松的隐私保护措施的一个最大风险就是数据的泄露和二次传播。如果有技术可以切断这种可能，那么数据采集、交易的安全性将会有巨大的提升。现在，区块链、安全计算、联邦学习等新技术的发展都在快速发展，这些技术都可以从不同方面防止数据泄露的情况产生。给定这些情况，可以考虑制定合规标准，允许相关企业在使用了以上技术的条件下，对于个人数据进行更为宽松的搜集，并承担可能的数据泄露所造成的损失。

其四，在通过法律、政策确定“隐私产权”的初始配置后，应该鼓励数据市场的发展，允许用户在自愿互利的基础上对个人数据进行交易。在现实当中，每一个人对于自己隐私的在意程度是不一样的，有的人很重视，而有的人则不太在乎。显然，在这些状况下，一刀切的隐私保护政策是无效率的——它在保护一些人隐私安全的同时，其实也剥夺了另一些人披露个人信息的权力。针对这个问题，一个比较好的应对方法是建立相关的市场，允许每个人自愿出售自己的个人数据，并获得相应的回报。当然，这类市场的建立前提应该是数据的使用和传播要有保障，否则用户在交易过程中就可能面临太多不必要的风险。

最后，应该加强研究，对基于隐私数据的滥用行为的风险和危害有一个更为科学、理性的评估，在制定相关的法律和政策时予以参考。从根本上看，对隐私保护更严格一些好，还是更宽松一些好，要看两种取向所带来的成本和收益。这里的问题在于，在很多时候，一些由个人数据引发的问题，究竟是不是真问题，又会带来多大的成本，其实是不明确的。对于这样的情况，就需要引入更多的研究来帮助我们的判断。这里，我想专门提一个问题，就是基于个人信息的价格歧视，也就是我们通常说的“大数据杀熟”。一般认为，这种模式是很糟糕的，会带来效率的损失。但如果从经济学的角度看，其实“大数据杀熟”这种“一阶价格歧视”是非常有效率的。而且从公平性上看，它也要比没有大数据时的“二阶价格歧视”来得更好。在二阶价格歧视下，由于信息不对称的存在，商家为了引导高收入、高需求的用户的购买，必须给予其“信息租”，而对于低收入、低需求的用户则会尽可能剥夺其消费者剩余。这样的一个结果就是，高收入高需求的人反而会得到更多的消费者剩余，而低收入、低需求的人则没有消费者剩余。从直觉上讲，这是不公道的。相比之下，一阶价格歧视则是让高收入、高需求的群体支付更多的价格，而让低收入、低需求群体支付更低的价格，这似乎更符合我们对于公平的感知。当然，在“杀熟”情况下，企业的整体利润会更高，而消费者的整体利润可能减少，这是一个利益问题。究竟应该怎么协调企业、消费者，以及他们中不同群体的利益，这是需要思考的，而更多的研究则可以帮助我们做到这些。

总而言之，借助经济学的视角，我们可以更好地看清隐私保护的宽松所带来的利弊，这可以为我们思考相关政策提供一个很好的帮助。