大数据时代数据采集问题

作者：课课家教育来源： http://www.kokojia.com点击数：1057发布时间： 2019-07-15 21:25:26

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。

在大数据时代，信息开放与隐私保护由于性质差异，已成为一对天然矛盾体。斯皮内洛将“善”置于道德核心的道德分析框架，为这一网络问题的解决提供了理论指导。但在具体分析过程中，这一纲领中的“抱有善意”会引发“善/恶动机界定两难”和“动机/结果吻合度两难”问题;“优先取舍”则引出了“此消彼长/利益均衡两难”和“既得利益/隐含危害两难”问题。伦理学中的两大基本理论“目的论”和“义务论”可以为“隐私-数据收集”问题的解决提供新思路。

“隐私—数据收集”问题的两难分析——基于斯皮内洛道德分析框架的视角

An Analysis of the Dilemma from "Privacy and Data Collection":Based on Spinello's Moral Analytical Framework

内容提要：在大数据时代，信息开放与隐私保护由于性质差异，已成为一对天然矛盾体。斯皮内洛将“善”置于道德核心的道德分析框架，为这一网络问题的解决提供了理论指导。但在具体分析过程中，这一纲领中的“抱有善意”会引发“善/恶动机界定两难”和“动机/结果吻合度两难”问题;“优先取舍”则引出了“此消彼长/利益均衡两难”和“既得利益/隐含危害两难”问题。伦理学中的两大基本理论“目的论”和“义务论”可以为“隐私-数据收集”问题的解决提供新思路。

In the era of big data,the unlocked information and privacy protection for their own differences in nature have been a pair of natural contradiction.Spinello’s way of putting“goods”as the moral core has provided the theoretical guide for solving the issues from cyber.However,“being good”in the outline has caused“dilemma to define good and bad”,and“dilemma of the fitness between motivation and consequence”.“Primary choice”makes the dilemma of“trading off and taking turns/balancing the profits”,and the dilemma of“vested interest/hidden dangers”.“Teleology”and“deontology”,the two main theories in Ethics can provide some new approaches for solving the issue of“privacy and data collection”.

关键词：斯皮内洛/善/道德/隐私-数据收集问题/两难问题/Spinello/Goods/Morality/Privacy-data collection/Dilemma

标题注释：教育部人文社会科学规划项目(项目编号：14YJA720009)，山西省软科学研究项目(项目编号：W20151038)，山西省教育高等学校哲学社会科学研究项目(项目编号：W20151025)。

大数据_数据管理_数据分析_课课家

随着互联网的广泛应用，数据信息时代为我们提供了一个更为开放的社会。但在这个开放时代，如何保证作为人类基本权利的隐私已成为摆在伦理学家和公共政策制订者面前的严峻挑战。这一问题同样引起了国际伦理与信息技术协会(INSEIT)主要创始人理查德·斯皮内洛(Richard A.Spinello)的重视，他在其几乎每本著作中都花费大量笔墨来阐释和论证这一问题。纵观斯皮内洛的文献，有一个“至高道德”观点始终指引着他的“技术实在论”①方向([1]，pp.1-9)，这就是“善”。在他看来，“在网络空间中至关重要的就是传承卓越的人类善和道德价值”([1]，p.49)。但在如何运用“善”来进行具体网络问题解决上，斯皮内洛讨论得不多。基于此，笔者试图从斯皮内洛“以善为核心”的道德伦理分析框架出发，对“大数据时代的隐私问题”(以下称为“隐私—数据收集”问题②)进行哲学层面的剖析。

一、斯皮内洛“以善为核心”的道德分析框架

斯皮内洛指出：“网络空间的终极管理者是道德价值而不是工程师代码。”([1]，p.44)但是这种将道德置于制高点的做法曾被学者质疑为是一种“道德乌托邦”[2]。事实上，斯皮内洛之所以如此界定是有其深刻理论根源的。这一观点源自于他对技术乌托邦论、技术决定论、技术中立论的系统解析：这三种理论虽不完全正确，但不乏可取之处[3]。技术乌托邦论乐观地认为人类能够根除技术所带来的一切负效应，这种说法给予人类运用技术改善自身状况并弥补技术缺陷以希望。但从现实来看，它的实用性有待加强，因为人类每次为解决网络问题而提出的新技术总将人类带入另一个困境，这是一个无限循环的难解之题。而技术决定论承认技术重要性的论点同样值得推崇，但它将技术夸大为超越人类控制能力、能够决定网络伦理走向独立力量的做法是不可取的。技术虽然重要，但若真将技术看作网络伦理的最终力量，那么人类最终将成为被技术控制的“奴隶”，而技术有可能真会如韦伯(Max Weber)所言，成为“幽禁人类存在的‘铁笼’”。与前两者相比，斯皮内洛的技术实在论更接近于技术中立论，即承认技术的工具性作用，但它与中立论者的区别在于：斯皮内洛认为技术并不仅仅是一个简单的工具，它是在影响网络伦理四要素(法律、规范、市场、代码)③中具有主导性的力量，是制约其它要素的重要手段[4]。

正因为技术既不是人类完全的“救星”、又不是控制人类存在方式的“铁笼”，它只是一个在解决网络问题中起着主导作用性的工具;因此，要真正解决网络问题，就必须对掌握和操纵这一工具的“人类”有所规范，只有通过为人设定道德价值标准的方式才可能避免由技术引起的“内在容易滑倒的斜坡”[5]。同时，斯皮内洛强调，这一道德标准若要成立，则需建立在两个基本假设前提之上：(i)道德观念和原则对于规范负责任的网络行为具有指导性的作用;(ii)自由的、负责人的人类具有控制技术力量的能力([1]，p.2)。

但是如何将这个“以善为核心”的道德分析框架应用于“隐私—数据收集”问题呢?或者说，这一道德分析框架在网络隐私问题中能够起到怎样的作用，又会产生何种问题呢?

在回答这些问题之前，首先要清楚“隐私是什么”。如果从有关隐私的文献中挑选的话，“控制说”和“限制接近说”会格外引人注目。前者的代表人物弗里德(Charles Fried)认为：“隐私就是当且仅当一个人能控制与自己相关的信息”[6];而露丝·嘉韦逊(Ruth Gavison)将隐私定义为“限制他人对个人‘秘密’、‘匿名’、‘独处’三方面信息接近”[7]的观点，则是一种典型的限制接近说。在对这些理论进行系统分析的基础上，斯皮内洛总结道：在信息密集型文化背景下，隐私保护已经由“探究何谓人类自由”扩展到“探究个人对自身信息控制权利为何”上[8]。当隐私作如是讲时，“隐私—数据收集”的两难问题就出现了：如何既尽可能多地收集信息并应用于相关领域，又让当事人保有对自身信息的控制权利呢?

接下来，若要探析“以善为核心”的道德分析框架在“隐私—数据收集”问题中的意义，还要明确的一个问题就是：何谓善?但这是一个较“隐私”历史更悠久、更为难解的概念。柏拉图在《理想国》中提出了“至善”，然而这个概念除了用“太阳喻”稍加提示外基本被他“道可道非常道”地沉默以对了[9]。亚里士多德则将“幸福”看作就是这种终极好(善)[10]。但我们能将这样的“善”界定作为“隐私—数据收集”的道德依据吗?即，尽量让数据收集者与/或数据被收集者(隐私被侵犯者)都获得幸福吗?很明显，这个概念并不适用于网络隐私问题。

就“善”这一概念而言，斯皮内洛也没有下过明确的定义，在他看来，“个体间并不存在一致的善的基础”([11]，p.74)。但通过对相关理论的深入分析，笔者发现，他的善主要是围绕两方面展开的：其一，事件或提出解决路径之初要“抱有善意”，这是一种“内在善”，它是行动的重要理由和规范的最终来源([11]，p.108);其二，判定事件或解决路径是否为善时要以“优先取舍”为标准。此即斯皮内洛“以善为核心”道德分析框架的主要内容。针对“隐私—数据收集”问题而言，“抱有善意”指的是在解决网络隐私问题之初内心要“保持一种善意”，这一理论源于康德的“天赋人权观念”，在斯皮内洛这里，“善意”是诸多天赋权利中最基本、最具代表性的观点[12]。而“优先取舍”是斯皮内洛针对隐私问题专门提出的一种解决思路：当隐私权和其它基本权利相冲突时，哪种权利应当优先是伦理学家必须考虑的一个问题([1]，p.136)。

但是当笔者用此两类观点分析隐私案例时发现，“隐私—数据收集”问题并不能彻底解决，而且还会出现一些更具体的两难问题。针对这一情况，斯皮内洛提出过一个解决原则：不同类型的伦理推理有利于解决网络空间中出现的道德两难问题和社会问题([1]，p.2)，即可以按照一个或多个伦理理论来进行网络问题剖析([13]，p.27)。故此，笔者选取了伦理学中的基本理论“目的论”(teleological)和“义务论”(deontological)来尝试对这一问题进行解答。

二、目的论与“隐私—数据收集”两难问题

目的论和义务论是现代伦理学理论的两大主要流派([1]，p.10)。目的论一词源于希腊文telos，意指目标和目的，其核心观点是：行为的正当与否取决于它是否达到预计的目的(如幸福、如善)([14]，p.742)。从日常语言角度来看，“抱有……态度”是人类行为之初所持有的动机，而“目的”与“动机”通常表达的都是相近的意思。在伦理学中，这两个词语的意思却有所不同。深究目的论定义容易发现，它重视的是“目的与结果之间的关联性”，即“目的是否能够收获预期结果”;但斯皮内洛的“抱有善意”则更强调“行为之初的一种善意”，不会太多考虑其结果。

针对当今社会的一些隐私案例，笔者试图从斯皮内洛“抱有善意”观点出发来为其寻找解决路径，却发现它们都陷入了二难推理中难以厘清。斯皮内洛的“抱有善意”指的是行为之初的一种“善动机”，那么相对应的就是行为之初就“抱有恶意”。从表面上看，“抱有善意”就是在网络空间中的一种“善传承”，而在行为之初就“抱有恶意”就如同从根上就坏的树木一样注定腐坏。但实际情况却没有这么简单，笔者选取了当今社会中“棱镜门”事件和为大多数人称道的“国家计算机匹配技术”作为案例来进行分析。

“棱镜门”事件：2013年6月，前中情局职员爱德华·斯诺登将两份绝密文件交予报社后，美国国家安全局自2007年开始实施的绝密电子监听计划——棱镜计划(PRISM)就被公诸天下了，除美国外的其他国家都认为这是一起赤裸裸的监听丑闻，是美国肆意践踏民权、侵犯他国隐私的罪恶行径。

“国家计算机匹配技术”是一种计算机支持过程，在此过程中，为找出感兴趣的事实例证而把许多相关的个人数据记录进行比较。1977年，该技术为美国许多州、联邦政府所采用。美国邮政局曾把自己的数据库与法律执行机构数据库的数据进行比对，以确定其雇员是否参与了犯罪([13]，pp.118-122)。这是最常见的一种数据重组方式，该技术常被政府部门用于检测欺诈行为或其他违规活动，涉及计算机匹配最多的两个群体是联邦雇员和福利接受者。

在被监听、隐私侵犯的国家看来，美国“棱镜计划”的动机就是“抱有恶意”的，就是想要通过信息收集来控制他国;而在大多数人眼中，“国家计算机匹配技术”至少动机是“善”的，它是政府解决欺诈和浪费严重的一种有效、积极和相对无害的方法[15]。但深入分析，我们会发现，其中存在诸多无法依靠“善动机”本身解决的难题：

第一，“善/恶动机界定”之两难。从人的本心来说，一件事伊始究竟是“抱有善意”还是“抱有恶意”是较好认定的，这是一种行为态度。但从现实来看，行为之初的“态度”是最难认定甚至是根本无法认定的，我们无法从行为来判定人的心里究竟是怎么想的，正如古语所言“知人知面不知心”。譬如上述两个案例，其他国家认为“棱镜计划”是美国侵犯他国隐私的罪证，而美国则宣称他的动机是为了“反恐”;即使“国家计算机匹配技术”多是为防止犯罪或福利政策而进行的技术操作，但也有人认为这可能是政府为达到不可告人目的而寻找的“冠冕堂皇的理由”[16]。

第二，“动机/结果吻合度”之两难。即使我们通过某种方式真的能够确定行为“动机”，但抱有善意也并非就一定能行好事，抱有恶意也不一定造恶果，这也就是人们通常说的“好心办坏事”。同理，在“隐私—数据收集”问题中，“善意恶行”或“恶意善行”之情况时有发生。即使“棱镜计划”真的是美国恶意侵犯他国隐私、试图控制他国内政的一种手段，但在这个过程中，通过收集到的更多数据信息来进行有关“恐怖组织”情况的统一分析，确实会起到一定的“反恐作用”，这算是一种“恶意善行”;而在“国家计算机匹配技术”中，即使国家完全出于“善意”就可以不经个人同意地将个人信息进行配对吗?“一旦计算机匹配情况发生，姓名被‘初步命中’的任何人即被假设犯有罪行，这是不公平的，是对‘合法诉讼程序的嘲弄’”[17]，这就是“善意恶行”了。

那么目的论能否解决“隐私—数据收集之‘抱有善意’的两难问题”呢?如果不能，为什么?如果可以，如何诠释?

第一，“善/恶动机界定两难”的目的论诠释。目的论着重是要从结果与预期的吻合度来看行为的正确性，但其前提是必须知道“预期(动机)是什么”，而我们这里的关键要点正是：如何确定动机，所以从目的论出发也无法解决“善/恶动机界定”问题。正如马克·罗兰(Marc Rowlands)所言，“想要从结果来推出原始的行为动机(意图)是十分困难的”([14]，p.745)。对于这一问题，笛卡尔也只能用假想中的“松果腺”来构想“心是如何发挥作用的”，而行为主义之所以被诟病就是因为“它将心的原始密码简单还原为行为”。

第二，“动机/结果吻合度两难”的目的论解析。虽然目的论无法解决“善/恶动机”问题，但是对于“动机/结果吻合度两难”的诠释还是有意义的。以“棱镜计划”为例，如果美国的动机是“反恐”，而且在一定程度上达成了这个目标，那么这时的“棱镜计划”就是一项成功的“善行为”;如果其动机是“反恐”，但结果却是在“侵犯他国隐私”，这时的“棱镜计划”就是一项失败的“善行为”;如果美国的动机是“监控他国”，且他也达成这个目的了，那这一计划就成为一项成功的“恶行为”;如果其动机是“监控他国”，但结果却是维护了世界和平，那么这就是美国进行的一项失败的“恶行为”。据此而知，只有当“棱镜计划”的动机只是“反恐”且成功完成这个目的时，“棱镜计划”才是一项完全“传承人类善和道德价值”的行为，其它或多或少都有缺陷，而要避免或完善这些缺陷，斯皮内洛选择的是“以技术为主导，综合政治、法律力量”的“技术实在论”。

所以说，从斯皮内洛“抱有善意”动机出发来解释“隐私—数据收集”问题容易使人陷入两难困境，但“‘当事人究竟是故意还是无意侵犯隐私’动机何以评定”这一困境用目的论是无法解析的，目的论只为解决“动机/结果吻合度两难”问题提供了新思路。

三、义务论与“隐私—数据收集”两难问题

义务论讨论的是行为过程背后的准则可否普遍化的问题[18]。康德的道德哲学是这一理论体系的代表，即道德观最能通过辨别和履行自己的道德义务表现出来，为了义务而做的行为才具有道德价值([1]，p.15)。但是存在于行为过程背后的这些义务究竟是什么呢?

在康德的哲学体系中，义务是“所有手段的至高无上的限制条件”[19]。但从这一观念出发很容易引起“道德律冲突”([20]，p.58)。斯皮内洛的“优先取舍”为这一冲突的解决提供了一条试行路径，即“当隐私权和其它基本权利相冲突时哪种权利应当优先选择”。在这里，隐私权其实也就是“我们尊重人类基本善或保障其人类安康的基本义务”([20]，p.102)，也就是说，当人类基本义务/权利发生冲突时，我们的重点不应放在“义务遵守/权利保护”上，更要侧重于“权利取舍”上，而既能“取舍”则就一定有“厚薄”，但这种解决方式并不完善，会出产生出诸多“隐私—数据收集”问题：

第一，“此消彼长”与“利益均衡”之两难。在“隐私—数据收集”问题中，斯皮内洛试图通过“优先选取”的手段来使得各方利益都产生最大的净期望效用，但事实上这一期望在很多时候都可能落空。因为在大多数情况下，一个事件中利益各方获得的收益并不是一种“水与船”(水涨船高)的关系，而更像是在“切蛋糕”，总收益就是一块大蛋糕，如果一个人拿得多了，另外的人分得就少。以“棱镜门”事件为例，美国政府通过监听他国的活动，确实可以获得一些“恐怖分子”行踪、行动等方面的情况，从而针对这些行为制定相应政策，从而避免了一些恐怖事件的发生，这不仅保护了本国人民的利益，还保护了他国人民和政府的生命、财产安全。但为什么这一事件刚刚被爆出就受到了全世界的谴责?这是因为，美国通过“棱镜计划”获得的利益除了“反恐”还有监听、监视他国信息，这使得美国更容易控制他国、维护自身霸权地位，这样美国在这次事件中就获得了那块“超级大蛋糕”(利益)，而这种利益的获取是通过损害他国利益而得的，这就是一种“利益的此消彼长”，在这种情况下是不可能“利益均衡”的。

所以说，在每个“隐私—数据收集”事件中，由于对“隐私”看重程度不同，“利益的划分”往往会呈现出“此消彼长”的态势，在这种情况下还想要“利益均衡”就是一件非常难达成的事了。

第二，“既得利益”与“隐含危害”之两难。这一两难问题归根结底是由“隐私”的非物质属性决定的。“隐私”并不像车或房子一样是实体的有形资产，大体可以估算其价值;它是一项隐形价值，所以如果侵害了它就可能产生“隐含的危害”。以“国家计算机匹配技术”为例，这一技术的应用确实产生了不错的利益效用，“使用计算机数据匹配技术从毗邻辖区查获双重福利领取者，这还是第一次协同努力尝试”[21]。但是它的危害也深深困扰着人们，“人们特别关心的是，通过数据匹配过程产生的这个数字人物可能引起的个人形象或对他/她行为的误解程度”[22]。

就这些问题而言，坎泽斯克(Mark Kaczeski)“义务理论”所规定的一些谨慎条件或许能为我们提供一些解决新思路：确信真的有希望实现我们想实现的道德目标;不可能存在可以兼顾两个相互冲突义务的行为选择;最小化违反显见义务的行为带来的影响。[23]

依据这三个义务条件，我们将“此消彼长与利益均衡两难”和“既得利益与隐含危害两难”问题分解为三个部分：第一，这两个问题要达成的根本道德目的是什么?第二，存在能够兼顾这两个两难问题的行为选择么?第三，如果存在是什么样的行为选择，如果不存在这样的行为选择，如何最小化违反隐私义务带来的影响?

第一，这两个两难问题的根本目标是想要既获取收益又保护隐私。从现实中的案例可以发现，要同时达到这两个要求是有可能的，比如“国家计算机匹配技术”虽然存在一些争议，但是不可否认它确实既维护了人们的利益又在尽量保护当事人的隐私，而且人们也通过技术手段和法律措施在逐步完善着这一技术，争取更大的利益或者保护更多人的隐私。

第二，存在能够解决两个“优先取舍两难”问题的行为选择么?在“数据—隐私收集”问题中确实存在既可以获取收益又可以保护隐私的技术或手段，但是这两个结果更多的是一种“或关系”，而不是一种“和关系”，也就是说，要么“利益获取多些”，要么“更注重隐私保护”。如果说想要找到能够完美地解决这两个两难问题的行为选择，那么结果就是很难寻到。比如，“棱镜计划”中美国利益的获取就是通过侵犯他国隐私才能获得的，他国利益消(隐私被侵犯)则美国利益涨(控制他国)，而“反恐”利益涨(信息集中利于信息分析)则“隐私”利益消(他国信息被窃取)，双全之策难以达到。“国家计算机匹配技术”亦如此，既要获得现有利益(检测违规行为)又要防止隐含危害(保护公民的形象完全不受侵害)的行为选择目前还没有出现。

第三，故此，至少截至目前，还不存在能够既“使得利益均衡”又“满足此消彼长”、既“取得现有利益”又能“防止隐含危害”行为选择。那么就需要进行一些最小化违反隐私义务所带来影响的行为：在“棱镜计划”中，美国如果宣称其目的是为了“反恐”，那么就可以选用一些大家可接受的条件来进行这项事业，而不是“不告而取”地“窃取他国隐私”;“国家计算机匹配技术”中，既然这项措施有可能造成对“当事人形象的误解”，那么就需要制定一些其他技术或规章来保障这一技术更好地运行，比如事先制定更加详尽的“匹配条件”，事后对“匹配结果进行更加严密的监管”等。

总而言之，“义务论”对于“隐私—数据收集之‘优先取舍’两难”问题的解决有一定启示性意义，它起到了提纲挈领的指引性作用，但针对具体问题则还需要更加具体、可行的原则和手段。

四、结语

在斯皮内洛看来，作为网络空间终极力量的道德只有在“以善为核心”理念的指引下才能发挥其最大作用，而这种善又可具分为“抱有善意”和“优先取舍”，但这一“以善为核心”的道德分析框架对网络问题的解决作用是有限的。以“数据时代的隐私问题”为例，依照这一思路会产生诸多“隐私—数据收集”两难问题，故还需要借助伦理学中的基本理论对这一问题进行更细致的分析。而笔者之所以选取“目的论”和“义务论”作为解析进路，是有两层深意的：一是鉴于其在伦理学中的地位和经检验性，二是因为它们也确能为这些两难问题带来一些解决新思路：目的论将隐私—数据收集问题中的“动机与结果”关联在一起，总结出只有符合“善动机(保护隐私、维护权益)—善结果(达成善动机)”的行为才能真正传承网络空间中的善价值;坎泽斯克的“义务理论”则将“隐私—数据收集”问题的解决方案界定在“最小化违反隐私义务所带来影响的行为”内，只有如此，诸般行为选择才能得以施行。而若要探寻其中未解之难的解决路径，则需从技术、法律、市场等具体学科或理论中加以分析。

注释：

①“技术实在论”是斯皮内洛最重要的一个哲学理论，具体指“以道德为终极管理者，以技术为主导力量，结合法律、政治、文化等要素共同解决网络问题”。参见[1]。

②“大数据时代的隐私问题”归根结底是由于数据收集者收集的数据信息可能涉及被收集者隐私导致的，它体现出了一种“信息收集—隐私侵犯”间的动态连接，而且本文更侧重于问题分析，故将“隐私问题”提前，“大数据时代的隐私问题”就成为了“隐私—信息收集”问题。

③莱斯格在其颇具影响力的书籍《代码和赛博空间的其他法律》中，首先描述了显示空间中规范人类行为的四种约束条件：法律、规范、市场和代码，他的这一理论被斯皮内洛看重，继承并发展为现在的以技术为主导、综合其它要素的“技术实在论”。参见[4]。

作者简介：吴文清(1972- )，男，山西繁峙人，哲学博士，山西大学哲学社会学学院，山西大学科学技术史研究所副教授，研究方向为科学技术史与科技伦理，E-mail:wuwq@sxu.edu.cn。太原 030006;杨小爱(1983- )，女，山西阳泉人，哲学博士，太原科技大学哲学研究所副教授，研究方向为认知科学哲学，E-mail:xa-yang@163.com。太原 030024

在实用中，数据分析可帮助人们作出判断，以便采取适当行动。数据分析的数学基础在20世纪早期就已确立，但直到计算机的出现才使得实际操作成为可能，并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。

踩(0)

分享到：

上一篇：大数据上演七宗罪