张文喜:数据与正义:从哲学和数学的诠释空间出发
日期:2025-09-23[摘要]数据化与正义的关系问题不仅牵涉计算机和法律科学,还广泛包括了技术存在的认识论模式甚至哲学形而上学。将正义概念适用于大数据技术领域,应当考虑数学自身的界限。对数据化带来的社会正义问题进行深入的数学方面的研究,能够满足我们对哲学重解时代精神的需要。在今天的世界,我们生活的普遍数字化概念的范围不能以简单叠加数字加以理解。在所谓现代性哲学话语扩展的同时,它已经包含有诸如自由观、技术观、机器观、数据观、政治理性、算法治理、规范科学观等层面的扩展。我们提出数据正义这个问题时,最终就应当在存在之间、存在与整体之间的统一性的意义上定位。
关键词:数学的观点 治理的算法 大数据 机器观 正义
引言
从功能式而非本体式定义上看,数据化转型是与信息编码成数据结构以及过程方式有关的获取和分析数据的一种能力[1]。在今天以机器自行产生的“智能”为主导“动因”的生产方式中,数据化不仅是一种对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合,而且是在一种数学和逻辑观念支配下形成“超工业化”演化的工具。从电报网发展到互联网技术,带来了现代信息机器体系的新发展;与此同时,人对其自身生产的总体器官或神经系统的整体研究将日渐成熟。人的治理所提出的问题要求算法和算法的治理。因此,数据化转型以及数据的广泛收集与利用正面临着严峻的政治、权力和人的解放问题的挑战。在这一层面上,人们在对数据化转型的审慎考量下,提出数据正义的呼吁。人们对数(学)的了解,就是它把握了一种导向性的时代要素,把握了人类的复杂多样性。
历史上,古代哲学曾假定人类世界本原在元素上是作为数学的特征展现的。它与数学刻画出存在本身的毕达哥拉斯主义信念有着深切的联系。它表明“数是一切事物的本质,每个事物就其本质而言是数。”[2]然而,当代哲学复兴了关于数学(论)等同于本体论的命题。[3]今天数学的权威正在形成大数据技术的权威支撑,这很可能是因为在由第二次机器革命拉开序幕这一世俗神话(即那些将数学计算与“对象的先天理论”等而视之但无法证明的信念)中,数学的神话清楚地显现出公理信念的特征:作为从哲学中承袭本体论的衣钵的数学或数据科学,其神话不言自明地被视为与存在之所为存在的本体(实体)论话语表达相契合,以至于有人得出结论说,一切都凭数据说话,只有数据化才能触及真。有大数据神话的助力,数的某种科学信念使得正义的社会建构由此免受根本审查。显然,这是一种有关存在之为存在的设定。对当代某种哲学来说,关于存在的话语是以一门所谓“存在的数学”为范式的(例如,巴迪尔、罗默等人的观点)。[4]从这个观点出发,在宣布现代机器体系融合发展和二次革命来临之际,人们看到一种渴望,即藉数学这门机智的技术关于社会科学的研究会不断进步,像数学凭其先天客观上能有效处置无法预测的和无法想象的量那样,人类社会将更有效率地应对人的行为管理和控制问题。在这个宣言中,当今文明社会正在发展的技术是以数数的技术(数字程序)以及理念-数论为基础。也在这个宣言中,所谓本体论形而上学之前被认为是合法的哲学话语,也只能在一种情况下适应数学地去说,或者在另一情况下以对数的模拟地去说。
然而,应当指出的是,我们不可以要求数学通过一种普遍使用的哲学方法去建构“公平”“公正”,甚至“美好”之类的理念。对于社会生活现实的实体内容来说,各种现象的价值(比如,人们对民主审议、公共推理和偏好形成或为承认而斗争等现象)以及偏离不仅超出了数学上的前提,而且还要求藉数学呈现出不连贯的和无限多元事实存在之本体论图景。这样,在形而上学本体论话语废弃中,在数据化转型对数论的重塑中,我们看到,用数学作为规范公平公正理念的坐标轴实际上取向唯心主义存在的理解。用马克思的观点来看,包括数学在内的科学“正向与哲学分离、向‘异化的形式’、向背离‘感性意识和感性需要这两种形式的感性’的方向发展”。[5]今天之所以要对数据正义进行哲学追问,是因为存在与特定的科学范畴(数和数学)系缚在一起只能归属于在场的形而上学。只要我们还在这个世界里理解哲学,理解哲学如何可以将存在者计算或者如何将它们归属于一个计量的统一体,把握存在整体的任务就不会完成(比如,人工智能显然不能思考整体性。若涉及思考计算机本身是否出错,就更难)。自柏拉图以降,哲学就不是第一次对数据正义进行解读,毋宁说它寓居于对数据正义的关注之中。
一、大数据概念与现代性的哲学话语
从词源上看,所谓数据(data,名词)源自拉丁文。它的意思是“被赠予的东西”。扩而言之,数据可以是指对任何形态下的任何具体事物(例如图像、音频、文字、代码等)的描述、测量和计算。它经过分析而变成信息,使信息系统数据化。一般认为,“大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资源。”[6]在哲学上,数据化概念就是将人类行为和社会交往活动转换为数字通信算术形式上可以收集和分析的数据。在那里,标志出人类技术所能构建世界本原,就是构建人类世界的整体性之“数”。从数据在某种意义上是商品、资料或财产来看,大数据技术可能导致正义或权义失衡。若以历史唯物主义为名提出一种数据正义理论,则应当将目前关注点从如何在一个公平的社会中分配商品或财富的主题,转移到对如何理解、反思和批判数据正义之于现代性话语的关系。因为数据正义总是陷于现代性话语的窠臼。不过,数据正义的现代性之咎往往被遮蔽了。数据科学家的关注点多在数据准备、模型学习和后台处理层次上,他们主观地认为,诸如数据挖掘过程中先行的偏见以及业已存在的排斥、不平等现象可凭借计数之纯粹透明性发展予以解决。
有一个假设是,数据只是在自己存在的基础上运算操作,如同它在“抽象机器”的概念意识形态上被订制一样。在我们的世界,数据存在于所谓“内在性的语言”条件中,超离于政治文化上的习俗语言。它们在结构上与我们的政治、伦理和审美经验所指的语言有本质的不同。用巴迪尔的话来说,“计数的——在被赋值的意义上——就是那些被计数的东西。”[7]而通过对数的关心所引发的现代性批判必须被安排在哲学主体范畴之中。很明显,一旦数据化的本体探究已经完成,我们就会深陷在还继续使用形而上学主体范畴的麻烦之中。
因此,首要问题是所谓二元论或主体/客体的问题,它的日常表达形式就是人与机器对立。我们知道,使人类行为和社会交往活动数据化的趋势,原本源自一种技术完满中为人际互联互通、互相谅解进而达到功能性团结提供中立方案的伟大智术设想。当工具、机器或大数据技术组合融入一体的人类世界并作为后者的内在表达时,它们仿佛自发建立起将人类作为整体来考虑的联系。与人工智能一起,这种理念的新颖所在将会在数字技术的盛行中被照亮。在本质上,当代计算机科学寻找机器与人耦合的真实条件,期望设想一个超越人脑的超图灵机,能够协调人类结构性不平等。随着人类技术把人本身的问题视为技术问题那一刻起,它就滑入无节制的技术主义(机器拜物教)的道路来把握人类。所谓的数字崇拜,是把数字当作神;在数学方法论基础上,所谓“算法社会”的独立性是从这个理念及其效应开始显现的。它有一种哲学本体论的支援,以使将当代社会经济现实跟大数据技术彼此统一起来。不少人为之自豪的是,在哲学和政治结盟的内层堡垒中有着功能可靠的、强大的数学思想。
然而,恰恰在这一点上,前已说明了只有数据在偏执地引导我们。当我们认为一切是数时,逻辑和算术的区分并没有确认如何理解神经系统所代表的计算机功能中的逻辑部分和算术部分的作用问题。现代计算机鼻祖冯·诺伊曼认为,这是“我们的思维习惯和表达思想的习惯”。当我们把算术过程视为独立于逻辑作用,就“很难表达任何真正复杂的情况”。[8]换一种说法,一种新的数学观念和大数据技术只有经过长时间的人类实践筹划才能与人类价值的现实接缝。
第二个问题是语言问题。冯·诺伊曼告诉我们如果神经系统是计算机,那么它们在结构上是使用人脑的语言,但它们与数学语言有本质不同。[9]若对语言问题的本质进行探究,那么,基本的问题就是:对人与机器关系的思考是否导致对主体(思维)范畴的耗损?当代世界异化表现是,人与机器的对立是现代性的主客二元对立表现之一。它像一条主线一样贯穿于现代社会生活领域中。以现代性话语的开启者黑格尔为起点,对主客统一性的强调之后,他提出在历史-政治领域中多种类别程序可能共同存在的观点。由此,在黑格尔式纯粹理性设定中获得超越现代性对立的理性力量。可以说,黑格尔的信念之实质就是这样一个准则:哲学既不能从主观出发也不能从客观出发,而应该从万物本原出发。这本原不是被“计数”为“一”(即逻辑数学化)的存在,而是绝对(所谓绝对,它实际上是世界的逻辑构成物,看起来就像是在电场当中,只有阴极或阳极是不完整的,它需要一种相应于其功能的内在的完整性,来构成一个封闭的体系。所以确实存在一个绝对的开始)。若黑格尔哲学(辩证法)把绝对理解为真正的现实,那么它特有的本体论上的困境就呈现在封闭的绝对中。原则上,黑格尔回避对那些能够在感性的时空中被看作持久的、典范的形态(数、集合、几何形式等)进行严肃的哲学探究。巴迪尔为此评论说,黑格尔式纯粹理性的本质是反数学的,是反理性的。因为理性即采用测量、计算、几何图形化和描述性分析的方法。在巴迪尔即使可能把黑格尔当做数学家来看,“黑格尔实际上不能触及无限”。黑格尔超越二元对立困境严格意义上是反对“数数的过程”。“‘好的定量的无限性’是一种典型的黑格尔式的痴心妄想”。他所谓的“坏的无限”、“好的定量的无限性”是一些所谓“差分化的无差的伎俩”。[10]因此,黑格尔哲学“在介入数数的过程中失败了。”[11]这里所谓“无差分的差异”,当然,是在辩证法意义上使用的。它不是指没有多样性的“一个”,而是指没有量化特别是定量无限性的障碍从而无法认识的量。在一种比较隐晦的意义上说,它与计算机代码相对应,而不是与世界完整的存在方式相对应。当我们谈论存在之为存在的数学问题时,我们可能正在谈论可量化的和可计算的知识和存在方式,一种由形式本体论结构决定的基本语言和知识方式。若将定量的做法像今天这样无限放大,如同今天它向程序员灌输那样,那么这里的量是抽象意义上的东西。人们所担心的实务例如警务实践中的“脏数据”恰恰是源于某种片面抽象的技术力量。
所以,哲学所应当思考的是,如何辩证地思考纯粹理性自身与大数据的关系。在这里很容易认识到,纯粹理性不适用于解释大数据。通常受过数学训练的人工智能,有一个数学的“超我”(如果我们可以这样说的话)。在这里,“超我”这个词既有推崇或推测的意思,也有对不确定范围暂且预定的意思。至于关于人与机器“哪一个更能干”之难题究问的维度而言,我们没有必要把它看得过于重要,只要辩证唯物主义地对待就可以了。特别需要注意的是,我们所谓的“已在”和“尚须”之间的矛盾:就前者来说,大数据推动了量化这种“齐物之不齐”的知识方式的发展。它“已在”,并导向了以所谓数字化生存取代现实的个人(因为在不同的数据库中被许多角色的实体取代,数字技术把大数据的本质带入社会存在连续性的过程之中)的处境;就后者来说,用人性化、质性的、清晰可读的和负责任的判断打开算法治理中的所谓“算法黑箱”。它“尚须”导向人作为被监视者的奴隶解放,作为机器的居间者(人是人与人之间矛盾关系的调解者)和开放者。我们在这里构想的是由前者与后者两个信念并联的规定:首先,从数学与哲学、生命与机器、功能与形式结构之间关系的批判出发对现代理性本质进行反思。我们今天可以畅想一个世界,一个所谓的哲学和数学追求的“普遍者和特殊东西的一个绝对的、实在的同化”[12]的世界,如同谢林在万物本原之建构的意义上所说那样。只有当一个人从数学角度阐释大数据世界,从哲学甚至宗教角度阐释人时,我们才能说前者是客体的方式,后者是对客体方式的消解。更确切地说,消解了作为表象形式的客体(即机器)以及客观属性与人性的对立。这是人与机器关系的一项重要的对比。本质上,哲学不同于数学(所谓“伟大智术”),正如哲学不会用数学理念去建构数据正义(例如,哲学不会用三角形的概念去理解让普通人过得更好的收入公平,以此得到应得的正义,好像它就是一个数量(“三”、“直线”、“角”)。数据正义的实质在于,所谓与生产方式相适应,三角形当然不包含此规范属性)。
这里,还应当指出,大数据有感性实践的意识(基于经济、阶级等)之来历。对它的发现不能只交给所谓算法或纯粹理性自身“计数为一的结构”[13]规则。准确地说,大数据技术不能依赖于逻辑的因果范畴作为对某一个个体或主体未来行为合理解释的工具来支撑自身。因为,因果性对应相关性,主体(人)是去因果性解释的。但这不意味着存在意义被等同于主体或主体性存在。相反,大数据对客体或客观性与主体之间的裂缝所弥合起来的关联很敏感。这种敏感推动了所谓实践者的“认知的精算方式”。而大数据所谋划的通向算法预测之路并非“认知的精算”的道路。所谓“价值中立的,因此是公平和公正”云云实际是闲言碎语。若依实践哲学来讲,如果从事社会分类的方式是客观的,那么它必然会毫无顾忌地捍卫抽象主体的存在,罔顾“程序正义、个人公正和社会后果如不平等的再现等伦理问题”。[14]若对应于一个机器学习的情形例子,那就意味着电脑的生存难以支撑人类价值完整性。或者说,数据正义是不能止于作为数学上演绎推理而发生的。
无论什么系统,在应得(这是正义的一般定义)与数据化公民的配对中,它都不可能否认除了休谟处理的那个问题之外,还有其他由关于存在的可调节的信息表达所提出的问题。当前技术因为过于精确化追求而导致社会风险叠加。就治理的算法而言,人类一步入算法社会,遂令正义语义混乱、破缺。计算机则充当了“双面”角色。一方面,计算机具有巨量的特定形式,比如,它具有“一系列二位置继电器操作的特定形式,它代表一系列加法运算”。[15]在其中,人像是工具的载体。他作用于机器,按部就班地执行行动,就像一个交通红绿灯讯号是等待,是行动,是集体生活和个人生活的规范的连接一样;另一方面,计算机也需要“所谓的决策系统。在操作机器之前,必须对其进行编程。”[16]在这种人机交互关系设定中,关键点是指规范从中而来且从中得到意义诠释的面向,这个面向就是信息交流。
第三个问题是形式与信息的关系问题。为了理解人与机器的矛盾,我们必须学会从形式的角度考察机器的本质(也就是抽象的形式要适应于机器内部的因果系统规律)。正如西蒙东说,信息应当比形式得到更高的重视。机器作为“使用形式”,其功能本身没有信息价值(意味着没有意义变化),机器呈现的形式,只能在因果以及数学中并通过数字来思考。因为数学形式关乎形式关系,关乎没有具体规定性的诸对象之间的关系,其本身在发展中并不能跟现实的人真正耦合。西蒙东甚至说,“一台机器的运行是没有意义的,它不能为另一台机器带来真正的信息信号”。假如人是机器的一种隐喻是对的话,那么人的“优势”在于能够将机器中的形式转化为信息。所以,生命有机体是信息化能量的载体。而信息是一种文化遗存,只有人以及生命才真正需要信息。[17]
从这个观点来看,若在人的生命与机器之间,不能使用一种所谓同一哲学构想的构想(比如,致力于同一哲学的预设,从统一所包含的诸种对立中发展出一个以思维的统一为统筹的计划),那么这是因为它们之间存在主和从或奴役和解放的本质关系。换言之,从历史观点出发,信息方式为生命范畴提供了解放的可能性条件。而形式范畴为分析机器本质以及将生命信息转化为形式的人机模拟关系提供了合理化工具以及一体性解释的构架。因此,通过一种根本的哲学阐明,作为使用形式的机器与作为生命存在多样性的信息之间的真实关系才能得以澄明。
二、大数据的技术中立化概念的假想性意义
依据特定的语义场,“中立”一词有不同意义,例如,客观性、实然性、不偏私、利益不相关、局外人,等等。在治理的算法中,大数据因其所谓具有比小数据更高一体性水平而被认为更具中立性的美誉。在这种新形式的治理中,关于数据系统的应用被视为纯粹的工具和手段的使用。它既不需要民主、正义、平等、人权或道德进步,更不需要进步政治体制的发展。作为一种技术手段,人们或许会设想,一旦大数据被视为中立的,也就被推定为是促进公平和公正的,比依靠有限的人类智能作为核心决策机制更公平公正。如今,大数据并同算法、算力以及信用体系一道构成社会或政府治理的支柱。可以说,技术的变化导致对所谓世界政治思维的改变。
在西方社会和政府治理的具体情势论述中,区别手段与目的颇有难度。当各国政府因各种复杂原因而面临治理困境时,政策应对的方法一方面植根于以经济关系为基础的个人主义意识形态,另一方面依赖算术和逻辑规则上的二进制,等同于达到治理思想的经济。自由主义者把自己对正义的理解描述成出于不可知的中立状态,认为数据化技术之正义性恰恰建立在决策者、算法开发者对算法如何产生结果、系统如何工作的不了解。归根结底,大数据技术发明者不是个体,而是集体主体。它是理性的,因为它比起遗世独立的个体来说要求更客观的解释。一方面,从大数据族谱上看,发明者作为主体并非需要一套固定的习惯、美德或性格。他只能就生产力、资金、环境各层面上的体现形式来理解。另一方面,作为发明,无论是为了服务受众还是为了提供信息,大数据的采集看起来具有双重普遍性。一是,比起基于小量原则的数据生成,它更看重“自动”(随机性)采集,除了算法目标函数的设计及其数据输入,大数据方法不大在意“特定的主体针对特定的目的”。[18]二是,大数据的采集模式并不会因技术和道德不可思议地扯到一起而导致某种不实际的不可计算的作用。用比喻的形象语言来说,铁塔和电缆服务所有人,就是建立在中立之上的。它们不是受限于某团体意识。这样,乍看上去,算法生成也给每一个人以同样的利用机会保持着一种人和技术的平等关系。与人们可能为之避免永远争论不休的形而上学、道德善恶这些对立相比所带来的统一体,人们开始迷恋算法所具有的所谓权威的中立性的治理功能。人们相信,如果没有这种在这些对立设定的困局中脱身之后的统一体觉悟,那么大数据技术在“使用形式”层面就会不可思量地跟神学、形而上学相联系。
但是,大数据技术的中立性不同于迄今为止所有其他领域的中立性。从价值论层面看,大数据技术中立性的预设已是概念的天真。在这种情况下,我们一般使用的中立性概念(例如,我们说某人正从“圈外”作出决策)也是最轻佻的误解。严格地说,大数据技术只适用于有限领域:实验室的研究及高科技的进展,比如相关性变成因果关系,潜在的风险转化为行政管理确定性研究等,由此清晰地呈现出国家权力在人工智能政治问题上的建构性影响;服务于所有人的信念态度无非建立在这样一个命题上:即人们在由管理转向治理中已经找到了绝对的、最终的中立性基础。该命题假设,大数据技术,能够学习并指导自己能够自己发现规范,无需由人类代理。或者说,其在谋求类性程序统一时会发现自己的相对独立性,并期望设想一个积极的、可能的人格神一样的存在。按照实践用语来讲,ChatGPT是可以用来和各个人进行“真人式”对话,但在其中被中性化、除去人身上的欲望、祛除邪恶的精神风险。在价值观上,这种技术中立论有利于将那些有争议的生命政治、医学伦理甚至意义和价值转变为纯粹的技术问题的方式来理解和处理。在技术的辉煌成就中,大数据技术布展了一幕没有私利的专业知识基础之上的工程师治国的剧目。
人工智能之所以有趣,是因为技术力量的抽象化、符号化。让·鲍德里亚说道:“只有一个抽象的,从不直接作用的智性,才能适应新的技术结构:然而这还需要人能适应,这种倾向只要求他使用高级的智性和计算功能的情境。对这个倾向深沉的抗拒,便会产生决定性落后。人反而变得比他的物品更不逻辑一致。”[19]这里,实在有太多的概念操作。我们并不想跟着鲍德里亚去考察这样一个新的操作场域的具体细节,以及人在其中的独特作用。重要的是,这些操作将人工智能时代建构为一个文化冲突的极端时代。大数据技术本身在文化方面展示了未来。对于我们可能有的回忆和记忆以及我们的整个历史来说,这个未来具有的首要地位。若不重视不同文化、国家和社会形态中那些以不同的方式展开的计算和量化的价值基础的研究工作,那么它将会把我们带入一种以数据为中心技术进步的神话逻辑和进步的盲目意识上,这样做的代价当然是数据宰制而排除了社会道德和政治异质性。当我们返回哲学与数学本原缝合处,这种异质性所带来的后果便清楚呈现出来。现在的问题是,在元素上,今天的人类世界是以大数据技术为面向,但是在统一体和整体上仍然以社会和政治努力为面向。如果我们能拒绝前者,那么我们总是早已接受了后者。如此,自批判性地理学家道尔顿和撒切尔提出“反数据行动”[20]的概念以来就表现为两种极端对立的观点:
一种是,对过分严格的、甚至被理解为“用数据说话”“用算法决策”的观点的反思,这是一种所谓非歧视性数字概念的意义上寻求思想未来的中性点,它整合了表面上异构的知识。这种寻求不偏不倚,将一切作为权力建构的数据化视为践踏正义,甚至视为一种破坏社会公正的明证。在本体论层面,若说人类的决策事先已固执着许多偏见,那么“反规范的正义”诉求在大数据技术性阐述上须通过“重申”对算法技术的“怀疑,或使怀疑可见”[21]而被建构起来。问题实质在于,判断在关于“数”的问题上的好的言说者与坏的言说者的权威究竟是拥有大数据的机械判断。因此,治理的算法之失误不在于精确性,而在于平均个体的出现,即算法系统并没有让个人真正基于自己的“个性化的特点”被评估。[22]对于一个数学问题的解决来说,这个问题是困难而同时也是有用的问题。它将引导从事社会分类的实践和提升到对算法、数据的价值论层面思考。
我们来举德勒兹的例子。他曾引用“分格”(dividuals)或“划分”(division)一词来标榜算法社会中的个性化立场。他认为,“分格”“不能用可识别的概念来构想完全个别性的事物”,它有更深层次的关注。如果仅仅从数字分类和数据本体视角来看,人脑的复杂性在这概念里已显多余,准确地说,在算法操作场域里所有个体都是彼此可替代的。德勒兹试图借批判“同一性”(意味着控制“差异”概念)的机制,来证明算法治理术从可治理的数字主体达到对个体(“活人”)宰制的想象道路。按照德勒兹的根茎思维,在技术治理水平,人与人之间的交往不是中心化的阶级成员之间的冲突,而是被技术物中介中表达的相遇。在这一水平上,人类的协调活动跟例如鸟类或鱼类中成员间局部沟通而实现相似。从这种所谓去线性的、中心化的一种思想想象看,它实际上抵制所谓社会正义概念的建构性影响。
从德勒兹的观点来看,迄今为止,还没有一种政府治理模式能够提出一个计算的现实与实际的现实相统一的治理“分格”概念。在更早的思想先驱那里,也存在通过人类社会似自然性的自我组织模式来对付个体问题被视为抽象的技术问题。我们想重申,这表明思想家对数据式异化无谓地扩张领地产生了抵触。德勒兹对分格这个词的描述的旨趣本是要接续对马克思异化理论的修正的批判。但即便认为德勒兹明白对人性的和社会的控制,对社会进行“精细化信息治理”,相信治理没有自然边界,相信个人的思想形象只有在正常进程中的某种断裂或例外中,才能从可治理的数字主体达到个体。[23]但从历史唯物主义看,数字主体不是主体,而是个体、偶然的个体。他应以他为市民、劳动者、家庭成员的名义来研究。德勒兹相信“分格”是与社会阶级的“个性化”概念无关的新的操作,但马克思要在共产主义经验和实现方面都将技术发展视为与人的解放指归紧密相关的社会和阶级政治的努力。资本主义社会是作为拟像得到了“正义的”这种质的。准确地说,数据正义恰恰导致歧视性的政治行动。
另一观点是:从为电脑编写价值观变化的理想的可能角度看,我们每个人所看到的是各个个别国家的情况是大不相同的。人类理智的某种成果或专业知识,比如说人工智能对大脑模拟,不能被简单说成没有自己的思想图像、出于纯粹学术动机的东西。西方现代性对全球资本主义提供了歪曲的知识描述,正如丹席克等学者记述的那样,需要警惕一种数据化下的殖民主义形式。由于“历史进程往往压制、排斥、边缘化和贬低‘全球南方’的知识”。因此需要“坚定地将当代数据化和数据正义的动态置于现代性的历史轨迹中。”[24]
这样,我们便可以问,人们究竟是通过什么方式得到这些数据,然后建构起数据化的类性存在多元的方式呢?首先,这样追问是迫切的。现在我们已经看到,连人类都无法完全识别机器学习算法运行模式。尽管机器学习算法本身也包含着怀疑的程序,但是不一定对逻辑上不可预测的令人不可思议的“内部运算”进行批判。其次,围绕非中心化叙事的争论,人们重新设想一个与全球资本主义不同的叙事。但由于充满历史的、理念史的成分,算法治理与数据正义很有可能只能再次回溯一种人类解放的言说。在之前,人们并不了解究竟谁在言说(阶级意识不明),也不了解那些主体说的到底是不是真的。正好像数学貌似自己取得独立性一样,人们容易在不知道数据来源的情况下,便冒用看似无害、无涉隐私的数据,这使数据正义(隐私)的真实涵义被数论精确性云雾所罩。正由于此,坚持数据正义论者进而犯了不停地攻击“正义本身的文法,都悬而未决”[25]的错误。而且,他们用来证明通过识别和提升数据化的方法来创造“更公正的世界”,实际上难以避免犯玩弄不可言说的抽象言辞的错误。当代西方哲学家手里没有别的资源,只有一个消解因果规律的理性概念或概率概念,以及海量数据的概念。按照实践要求来说,一种算法结果的解释,只有相关性而无因果性。韦尔斯观察到,解释上的偏误“不仅仅是算法使用的结果”,而且是对技术性的宗教信仰“道德、情感”混为一谈的结果。[26]当代马克思主义发展已注意到,应该为人工智能之计划确立一条基本原则:各个世纪技术的各种发明之所以有意义,当且仅当它通过扩大知识的边界和人的解放而促进从少数走向多数的愿景。
迄今为止,技术发明之涵摄人类价值之所以可能,只能在允许工业领域更敏锐的转型基础上对人类理智的某些成果进行社会制度、主体性批判性探索。就此而言,将大数据视为难以抗拒的技术力量,乃是偏见;从历史唯物主义看,它依然只是一个现代性的统治形式,一个源于准宗教信仰的东西对国家现实的实体进行统治的形式。因而,现代虚无主义和数据中立化概念的主要标志就是科技万能,而其最终导致了追求纯粹实体而放弃世界现实的实体追求。在这个意义上,在数据正义理论中,去实体化与形式化乃是问题的关键。换言之,人们不应当将数据化发展视为抽象或分离的中立性领域,而应当将数据化视为一种政治经济体制发展中的利害关系的曲折反映,而正是在这里,技术本身无所谓好坏,但对技术性之构造必须通过不断撕开技术的整体形象方得正当。而且,对资本统治的任何实体化也须加以抵抗。其背景,恐怕是一种多民族国家的包容相互对立的社群划分历史状况,这是马克思世界历史理论的一个新主题。我们可以先决地说,一台运算能力极强的电脑也因为毫无世界性可言而被识别出是机器而不是人。此乃是对人工智能了解的最基本的事实。
通过马克思主义哲学,在对智慧城市或政府管理问题的批判中,我们不再追问更高效的数字算法如何可能,而相反去回答,由于历史主体的存在,我们已经努力趋向算数对象的价值之主体性的源头。也就是说,以效率来理解大数据技术的意愿,不能解决这一技术的现代性困局。我们应将数字和算数系列的客体性——相关地,还有算术态度的客体性归于算法实践者的科学,即历史主体何以可能的科学。这将意味着重新降回到数学独有的感性关系、降回到可感性的集合体,降回到前数学结构中提供给感觉的复合体和整体性上去。因此自然倾向于掌握对象、劳动工具、仪器、机器。格奥尔格·齐美尔为此认为,这种向感觉的回归超越了“非常巨大且清晰可见的社会结构”,并且“有助于重新定位关于城市承诺的最佳人类生活方式的假设”。[27]这里值得指出的是,实际上,少有一种数据理论对大数据的场景化进行过诉诸审美的探讨,它们往往偏重技术流程而忽视信息和通信技术所关系到的各种感性或“个性化”及其反作用于人类自身存在的感觉存在论问题。
从本体论看,最重要的是要识别与区分计算机程序运行时的不同层次构成。若人们想要构造“算法”,至少从最低层次上看,与其说,计算机系统程序是物质的基本粒子(比如原子)的成分构成,不如说,它是依赖于海量数据输入来提供输出的过程以及“模块化”的成分构成。对此,计算机学家侯世达认为,在此存在着如何“用已知的实体定义新的高层实体,然后用名字调用它们”的问题,其中存在高低层级语言之间的翻译问题,对此以上已有阐述,这里就不再赘述了。要言之,计算机科学(尤其,人工智能)的决胜之地在于语言的不断开发与改进,“但那需要人付出较大的努力”,同时“编写出来的程序可能长得使人无法把握”。[28]仅此一点,我们今天可以确信:人与机器同样处于一种紧张的双向关系(“人是机器”和“机器是人”)发展之中。对于马克思主义哲学未来思想而言,大数据技术(作为机器和人之间的相互作用的辩证中介)的现实是以奴役和解放决定性概念为基础。我们既不能根据那种“黑箱神秘主义”来理解大数据技术,也不能把大数据当成科学魔术师的巧思。再说一遍。马克思在生产力对技术的态度层面上把管理、治理的技术当成工业技术辖域中的一个因变量而已,与此关联,所谓普遍性的算法治理背后是一种起源于意向都不普遍的东西。绝对不可小觑的是,在国家和全球治理的背景下,捍卫与数据有关的好的正义言说是努力从功能上将一切实体的技术概念加以解体。
三、数据化治理的规范意涵
在今天关于治理思考的形态中,已经显示出对算法的倚重。在本体上而言,相比算法和算力,数据是根本。它的重要性在于,以“数目字管理”为出发点对国家治理的现代化观念和欠缺数目字管理而产生出政府权力滥用的观念。[29]这意味着,直到英国经济学家威廉·配第将统计学方法应用于社会科学前,所谓“政治算术”,没有规范,仅仅有法律。因此认真地说,实际存在的规范是法律。然而,将作为强制性的法律,与作为真正的法律加以对照,具有强制性地位的法律,以及规范性基础,决不是随便任意的、实际的规范乃至法律规定。充当合法主宰者的规范,必须是某种本原的、最终的,本质上具有规范化的程序、程式和编码技艺资质之物。换一种说法,从治理的规范化来看,用来支持数字化分类的理念可以分为本体论的、唯心论的、唯实论的、唯名论的诸多不同的理念。这种不同的理念形成只能够透过规范化技艺的形成来考量。当我们考察了基于大数据的自动收集、汇总的分析理性之后,就会看到作为政治算术知识是从一种非理性的理性中产生的。一方面,一般而言,“对数字计算机程序设计的理解是基于实证研究和个人经验”;[30]另一方面,把特定的数字化形式配置到治理知识领域还存在难以估计的风险。当治理的算法的社会后果被认为有政治、法律或社会效力问题时,它的问题主要集中在由超个体的行为模式和个人档案之间相互引发的关系。
首先,让我们看到治理的现状。实际上,在今天,对于治理者来说,他们所操心的问题还是将治理的算法升级为发号施令的权力垄断系统,还完全处在人们所说的算法如何规避“主观性”或“反思性主体”[31]的治理术分析的层面上。福柯认为,从人们可以把数目字管理引入治理术的时候开始,算法不再注重财富分析,而是开启了一种“他者可能的行动领域。”[32]它是由机械判断构建的权力领域。在既定的计算活动中,它可以无限次数地执行由人类设计的操作。在这领域,每个人的数字化特征和分类基于算法治理术构成的“数字泡沫”。换言之,在机械判断世界里作为几近无限的社会类别的存在,“人们几乎不了解他人的世界,也不了解他们是如何被他人治理的”。[33]从这时开始,匿名化工具宰制的控制社会的问题,在这个数字虚构主体的光晕下初次显露全貌。
这里,应该注意的是,计算机程序中的“组块化模型”这一概念。这一概念可以用来刻画算法预测、引导或约束人的行为的悖论:即通过保全简单性与牺牲确定性规范人的行为。或者说,“组块化模型”的概念被看作是一种对算法预测精确性之不可信任的阐释。从知识表示的角度看,大数据、人工智能和自动化决策系统关系到无限是不断生成和增长的范畴。这意味着,人对计算机编写程序所引发的内部过程并不认识。一般说来,也不明确意识到由此触发的计算过程。用一句老生常谈的话来说,“计算机只能做你告诉它去做的事”,但同时,“你不能预先知道你告诉计算机去做的事会导致什么结果”。[34]这意味着,“在你思考和编写程序的层次上”,关于何为正义、何为不正义就无法在“你编写程序的语言层次上”开启一个新的知识领域。这里的关键在于正义论证所要求的祈使句和命令。或者说,在信息和通信技术编码的程序中,绝大部分语句是类似于陈述句和建议。[35]数据化促进了程序上更大的形式化以及对程序实施的日益增长的专业化。如果从规范或规则观点将数据流同时看作是程序的体系,就可以清楚地看出,人工智能实际上在不同语言层次上如何描述人与机械判断之间的相互关系(譬如,棋术大师的全面综合思维与当今最好的下棋程序的算法之间的区别)尚未得到澄清。可以说,一条数据、一片知识都待“开发出相当于一种新的语言或新的形式系统的东西”。[36]
其次,大数据技术引发的数字法学问题。从一种反思性主体理论视角看,算法的治理已经充分运作于从福柯所谓的规训社会到控制社会之中,这将蕴含着人所创造的新的工具如何重塑国家、民营企业和公民之间的权力关系的不同版本。在这个意义上,数据化时代的社会正义动员无法直接用某种制定法或整个法律制度正义版本来说明的。以法学解释学为中心对算法应用的风险规制和数据权益的法律归属予以讨论,大致只是法学学人的事情。法学领域的相关研究已经走向了算法原理具体化精细化。但由于算法应用丧失它们原本为人们所熟悉的古典权力规范意义,它的规则是否具有纯粹规则性质亟待厘清。尽管法学家似乎都有意将算法应用的规则纳入法规条例,进而规范数据收集和处理的规则,但在某些场合,他们自己也在追问,由于算法缺乏数据透明度和可解释性(所谓“算法黑箱”),法律或规范的效力是否适用于某些极为特殊的现象。譬如,如何判定某些算法预测应用于对特定的人或物进行量身定制式治理是否违法或缺乏正当性。不容易判断的是当规范体系相互冲突,亦即处于政治斗争的时候。这时关于治理的算法的法律规制有二种可能。第一种可能性是,由于万物皆有数(据)具有普遍接受的规范作用,因此算法应用规则排除了“政治”这个问题之后,它还是有政治效力的问题。姑且不论法律和政治之间究竟是什么关系。第二种可能在于,由于诸规范体系当中没有哪一个整体而言是具有社会实效的,因此诸多规范体系都不是有效的规范体系。人们就是基于这一视野来解释数据不透明、算法自动化、数据化分类的新颖性。
其结果就是:数据的控制、占有这个主题。如果数据寡头垄断是通过把它作为私有化、网络中立加以分析的法律制定的效果,那么法律有一个漏洞——换句话说,有一个在公共产品的缝隙中掠夺、游移,维持着他们的剩余价值。那为何不直接把这个漏洞补上呢?何不将公共产品的属性添加到数字法学规条中?当然,与其他法学相比,数字法学是个庞然大物,并非天衣无缝。对于个别规范而言,如果数据具有资源和商品或财产的属性,那么哪一个更可能呢?到底是数据产权安排应当更有利于强势群体,还是应当更有利于弱势群体?倘若我们对这系列问题细加思索,就会发现尽管数据和算法本身都存在某种抵制私有财产权化的趋势。[37]法学界对数据财产权的性质,在法律制度上如何安排仍然存在多种疑问,如果数据财产权是由像数据规模性和数据处理过程的无限性、分享和交流之类的性质决定的,那么数据永远不完全是“个人”的财产。对其非确权保护就是不可逾越的。但是,在一个关于推进个人数据所有权主张的纠纷和推动民主的信息市场的议题中,大多数数据法律法规侧重考虑的,不是“数据的关系性和群体层面特征以及个体的伤害”问题,而是“个体层面”问题。[38]这意味着一种混乱的产权格局。在斯诺登泄密事件(Snowden leaks)之后,对数据正义的呼唤实际上成为西方数字政治经济体制历史发展的一个必然的阶段。
再次,计算机信息科学可能改变正义论哲学讨论的方式。随着技术资本主义财富不平等的加剧,各国在解决数据驱动系统如何决策过程方面都做出了限制数据收集技术的各种方案,进而将正义原则跟数字和通信技术联系在一起。当然,正义主题并不是伴随当代数字化生活经验和数据处理实践才出现在政治舞台上。
在西方古典时期,文化的价值在一定程度上在于通过数学,亦即通过“个别的量之间的比例关系”勾勒出“普遍者里面的特殊东西”[39]来体现。相应的正义概念自然是以某种优长应得或算法为导向。以柏拉图对理想数字的结构特征强调为例,他开始将数学和政治,将作为普遍者里面呈现特殊者的演绎理论与城邦政治联系起来,将其变成思想政治教育的坐标。随着对存在之间、存在与整体之间的关系认识的发展,哲学所面对的是作为特殊的东西里面呈现出普遍者(归纳思想的图式)的转型可能。因此,亚里士多德的数论迈向了通过运用运算来理解数字的道路。[40]这样,在古希腊城邦政治危机中,在作为真正的理性原则是数中认识之后,作为好的、坏的、善的、恶的规范就在正义理念的辖域内创造出来。直到当代,罗尔斯的正义论赋予了“算术性的不平等分配”[41]以一种结构的规范视野。就此,我们对数的了解,就是它把握了怎样从数学中推理出正义,这就是时代的要求:引述数学的可能性是由于诸如风险与安全、猜疑与团结、过错与责任、权义失衡与公正大都可以在数学的存在(离散数学、概率的计算、统计学等)中思考。
我们对大数据技术的了解,就是探索一种为所有人提供的未分离的、非工具性的语言,一种发现言说本身的扩展性和灵活性的理解类之间关系的声音。比如,在数据化对一国公民可能产生结构性悖论的影响中,“知情同意规则”可能变成“被迫(或诱使)同意规则”,或者说,同意变成强制。而“数据个人主义”本身又可能被定义为强制与同意的结合。这是“知情用户和数据个人主义”深度纠缠的本质使然。[42]与之并行的是一种控制论或数据驱动的资本主义社会秩序。弗里德曼看到,数据化转型只有允许新的政治的和社会的“参与者进入并实现分布式控制”,才能“带来民主化和去中心化的巨大平台,但垄断趋势已成为科技行业的定义”。[43]对于我们来说,弗里德曼探索的问题有些陌生和超前,而他使用的理论工具又来自新自由主义,导致他的观点出现了飘移,并偏向“同意”一端。在这里,只要数字科技公司达到空前未有的财富控制水平,任何关于数据生成和收集以及与价值创造之间关系的非编偏向“强制”的说明,都是不可能的。
在上述讨论的促进数字社会正义的知识状况中,实际上还面临着一系列的悖论情形,比如,个人数据的控制和国家安全,授予公民解释和挑战算法决策的权利和算法自动化决策更透明的实践,公民知情同意的概念和自动化的国家-公民关系,公民知情和能动的数据社会参与和公民履行数据主体的知识和能力欠缺,等等。在这里,难在理清哪些是属于规则或规范论思维提出的问题,哪些是属于决断或决定论思维提出的问题。更关键的问题在于,数据究竟是“个人”的,抑或是“非个人”的?理论界给出的解答是混杂的。一方面,不少反对数据主体即个人公民的声音的观点认为,个人为本位的数据规制具有局限性。一个由个人主义导向的数据保护规则,不但难以成为正常法律状态,而且会翻转为非常状态,一种由个人公民作出进入正常/非常的状态之决定的状态。因此,数据主体的个人化对于我们讨论数据正义问题及其价值创造、精英利益和历史趋势的关系具有根本意义。要理解这一点,就必须回到算法治理术所描述的超个人主义本体论的语境。坦率地承认表示正常状态的数据保护的法律规范,承认数据通常与他人的关系、以及个人在集体中的价值和位置的关系。我们对数学在历史上构成思想可能的了解,就是它把握了无限集合是其成员可展开成无限部分的集合。最后,一种数据而非另一种数据的形成过程总是受到现成社会结构和力量的影响。归根结底,我们应当正确认识现实世界和数字关系,即,只有数学适应世界,而不是相反。恩格斯曾经说,“数学公理对欧洲人来说,是不证自明的,而对布须曼人和澳大利亚黑人来说,肯定不是这样。”[44]冯·诺伊曼也说,数学的“表达形式是历史和偶然性使然。”[45]与此关联,通过数学是必要的,其原因在于“它是一种社会的建构。对此没有任何内在的理由”。[46]
四、余论:数据化问题与政治经济体制的联系
数据正义作为一种社会的建构,仍然有一个关于适应政治经济体制的问题值得关注。虽然马克思没有信息方式这样的概念,但其政治经济学批判将我们引向了这个问题。这种问题的关键是什么呢?
第一个层面,马克思认为,在资本主义生产方式下,由于工人缺乏所有权,与机器之间的关系是疏离的,机器与作为生命需要的信息之间没有交流。如同一台机器不能为另一台机器带来真正的信息信号,工人之间缺乏有机的真正联合。“机器不是使工人摆脱劳动,而是使工人劳动毫无内容”。在这里,“由于劳动资料转化为自动机,它就在劳动过程本身中作为资本,作为支配和吮吸活劳动力的死劳动而同工人相对立。”[47]拿马克思对机器的这种分析来类比,“计算机存储的不是死劳动而是死知识。它取代的不是工人的手臂和肌肉,而是他的记忆和计算的智力功能”。“马克思在工厂里看到的死物(机器)控制活人(工人)的‘本末倒置’现在被计算机扩展到了知识领域。”[48]第二个层面,在大工业的历史状况下,大数据技术构成的程序以及发挥的作用,形成一个脱离了人身限制以及社会关系的真正的机器体系(所谓的“用机器制造机器”)。[49]类似地,今天算法产生的数字化知识正一步一步与人类某种有生命的东西分离,从而形成“数据在‘方法’的各个步骤中无声地流动,不受人为干扰”[50]的景观异化。第三个层面,要使人类和机器合并成一个更高的统一体,或者说,不应把互不对抗的人和机器对峙起来。人类对机器的正确理解应当是建立在人类的作用发挥在机器之间而不是凌驾于机器之上的基础上,因此大工业应当有一种真正的技术革命性的结合。马克思不是从他本身所具有数学或技术知识出发,而是从生产方式变革历史出发,深信以自动走锭纺纱机为代表的自动体系是一种新质生产力。[51]面对更加自动化的机器发展路线,马克思“以自觉应用自然科学”来扬弃机器形式所造成的异化,并提出“以劳动资料为起点”的“生产方式的变革”策略。[52]至于说设想当工人在所有权上拥有机器时,有关机器形式与生命之间的鸿沟会突然填平,这想法是不足信的。就异化的克服而言,即要返回到更广阔的社会历史深处。在这个意义上,大数据技术是一个历史发展阶段的实践知识。第四个层面,机器的生命(如果可以这么说的话)是形式的收集和修改的生命。人的生命是一种意义发现的生命。换言之,必须引导人类从资本主义使用人类智力方面的局部胜利走向以人类解放和文化关注的整体目标。要使人重新掌握新的世纪而不是仅仅支配几台机器的运行。要使人类的生活更多样而不是更扩张。
张文喜,性爱电影 教授,博士生导师。
原文刊于《浙江社会科学》2025年第8期,注释从略。