【摘要】随着大数据进入大众的视野,数据伦理也逐渐成为人们所关注的焦点。数据伦理应是从数据视角对人的各种行为所进行的伦理关注。在数据伦理的范畴中,隐私为数据伦理研究的核心,而数据管理则构成数据伦理的内容。由此出发,“权利”与“权力”的重构应成为思考或者解决数据伦理问题的路径。具体体现为以下三点。一、网络平台与网络用户关于数据的新契约思路;二、网络平台数据管理的正确价值观引导;三、数据管理要进行严格的伦理风险评估。
【关键词】数据隐私;数据管理;隐私审慎
“大数据”广泛应用于各行各业,关于“数据”的探讨范围越发宽广。目前在互联网和大数据深度发展的基础上,人工智能的快速发展催发着传播智能时代的到来,由此“数据”问题被进一步强化,其所具有的意义亦由技术层面而延展至市场、社会层面。在智能传播时代,数据与网民个人的隐私之间有着勾连,也因此使数据伦理问题日渐凸显。
一、数据隐私与数据管理:数据伦理范畴的核心与内容
“数据”首先是一个科学的概念,是指“能够被数字化传递或处理的数字形式信息”[1],是对于已经发生的行为或者事件的客观记录与呈现。数据与信息之间存在着密切的关联,客观的数据中包含的是人或物的信息。因此“数据代表了物或人所具备的特征”[2]。从社会视角来看,这些特征都是基于人而产生的。随着互联网的普及化,网民的各种网络行为构成了大数据。所以,数据伦理应是从数据视角对人的各种行为所进行的伦理关注。在伦理学中,正当与善是两大主题。在数据伦理的范畴中,这两大主题聚焦为数据隐私与数据管理。其中,隐私为数据伦理研究的核心,而数据管理则构成数据伦理的内容。
(一)数据伦理研究的现实驱动
数据科学属于信息科学的范畴。所以,关于数据伦理的关注还应回溯到信息伦理学的范畴之中。信息伦理学是伴随着信息技术的发展而逐渐形成的研究领域。信息伦理学的兴起与控制论的创始人诺伯特·维纳分不开。20世纪中叶,信息技术的发展使得人们开始了关于人工智能的设想与实践。维纳具有预见性地认为,让机器像人一样思考并非不可实现,但是一旦人出现问题,那么人工智能体将会对人类社会带来不可控制的灾难。从伦理的角度,维纳称信息技术发展的责任为“伟大的正义原则”,后来的学者则将这种责任原则具体化为“自由”“平等”“仁爱”等道德规范。此后,随着信息科学的发展,肇始于维纳的信息伦理思想的研究元素与研究框架逐渐清晰和完善。美国学者詹姆斯·摩尔强调指出,新兴信息技术的发展需要有更好的技术伦理规范,进而他提出了摩尔定律:“伴随着技术革命,社会影响增大,伦理问题也增加了。”[3]信息科学在当下表现为互联网、大数据及正在兴盛的人工智能等技术的迭代发展,信息伦理学关注的内容正是这些技术在与社会相互作用的过程中不时凸显的道德规范及其困境问题。计算机伦理、网络用户的在线信息、互联网与信任、信息技术与个人数据等不断充实和丰富着信息伦理学的内容。
作为信息科学的一隅,数据科学在当下发展迅猛,并且以“大数据”的形式凌空飞入了大众的视野。当下的数据不仅仅只是科学家们研究的内容,也成为社会个体关注自身权益的载体。
目前的“大数据”在很大程度上积累于网民们的网络行为。数据是人们网络行走所留下的网络痕迹。网民们的网络行为包括各种网络访问、搜索、社交等,人们的网络行为留下的网络痕迹,被服务器存储下来就成了数据。其本质是指相对于所调查的对象而具有的全样本数据的特点。但无论是就这个概念产生的技术背景,还是目前大数据处理的技术特征,人们更多地将大数据指向互联网的使用所形成的数据。因此在一定意义上,“大数据”等同于“网络数据”。网络行为的产生需要一定的条件,在网络痕迹中包含着大量的个人信息,随着智能时代的到来,将会有更多的个人信息通过各种方式进入到数据世界中,在积淀着数据科学研究基础的同时,也将使数据的应用及其结果面临着巨大的数据伦理风险。在具体的数据隐私以及数据管理中,数据伦理风险的主体则具体化为网络用户与网络平台。
(二)个人信息与隐私审慎
隐私来自于个体对自身信息的管理,因此信息也就成为从数据到隐私的一个关键的中介。对于网络平台而言,网络用户的行为首先是以数据的形式存在的,进而根据一定的利益需求而对其中的信息进行分析,关于隐私的伦理问题继而产生。
“现代哲学的解释提出这个假设:隐私被视为一种权利,一种保护自己不受他人或机构行为侵犯的方法。隐私承载着支配和受限访问的内涵”。[4]因此,对于“隐私”而言,“支配”与“受限访问”体现着其本质的主观性,也就是“隐私”的边界具有主观的审慎性。对于不同的个体而言,隐私存在着边界的模糊性。由于关乎个体的自我信息,所以,无论是从“正当”而言,还是从“善”而言,在具体的数据管理中,都存在着一定的伦理问题。
(三)数据管理与伦理风险
数据管理包括两个方面的内容,其一是数据的挖掘与存储,其二是数据的利用。在数据管理中,由于数据来源的特殊性,所以在数据伦理中,隐私成为出现伦理问题的核心。进而,围绕着个人信息以及隐私的主观审慎,数据管理成为伦理问题的内容构成。
在这里,存在的伦理问题是,平台获取用户的哪些信息?获取的手段是怎样的?这是伦理范畴中的常规问题。用户和平台之间,存在着一定的信息不对称。每个网络平台都有自己的技术逻辑,对于平台背后的支持,很多用户并不是很清楚,许多用户是把平台作为一种公共产品进行使用,但是平台方确实非常清楚。这种不对等的情况,对于用户而言,具有一定意义上的不公平性,换句话说,平台方获取数据具有一定的不正当性。同时各种智能性设备,可以在人毫不知情的情况下获取信息,形成数据,其中可能存在隐瞒甚或欺骗。
从伦理的范畴来看,在平台和用户间存在着数据获取的不正当性。在资本的驱动下,平台不仅仅只是存储数据的仓库,更希望从这些仓库的内容中能够为资本带来市场价值。数据的价值,一方面是直接提取用户的个人信息,另外是从中洞察出用户的生活习惯、消费方式等。在这里,另一个问题浮出水面,即如何使用用户数据。
二、网络传播中的数据类型与数据管理
信息技术的发展促使传播从形式到内容都在发生变化,而这些变化在一定意义上与数据有关,因此,数据管理就成为智能传播的基础。智能化传播在一定程度上达到了传播最初的初衷,能够将传播内容与受众群体进行密切关联,但同时,这也带来了更大的争议。因此,从形式上来看,具有导向和温度的传播被转让给了冰冷的“算法”。所谓算法就是对网络用户所积累的数据进行的挖掘、归类,基于这种定义,“算法”也就是数据管理。
(一)数据类型及其伦理风险
根据网络使用者网络痕迹的留存方式及其特点,可以将数据区分为如下类型。
其一,从平台所积聚的数据来源看,可以区分为主动型数据和被动型数据。主动型数据是指用户主动留下来的数据。比如用户使用引擎类平台寻找信息、订阅信息,利用社交平台进行人际交往或状态表达等。这些网络行走行为一般源于用户自主的选择,对于平台而言,这些数据属于用户主动贡献的数据。但同时,很多平台在存储用户主动数据之外,还会附加一些条件,比如要求用户驻留一些具体的个人信息,比如地理位置、运动数据等。这类数据可以归类为被动型数据。而从技术的可能性上来讲,当用户使用平台时,一些物理的个人信息已经驻留在平台的大数据存储器中了。而这些附加条件,在一定意义上是为了规避用户“知情”的权利规范。这些做法,从形式上来看,仿佛体现了平台的责任和对用户知情同意的提醒。但实质上依然是技术工具主义的表现。
其二,从数据所反映的用户特征来看,数据又可分为直接型数据和间接型数据,这是从数据的使用目的角度进行区别的。直接型数据是指直接反映用户特征的数据。主要是在搜索引擎类平台积聚,这类平台留存的用户的数据具有消费的直接性,也就是直接用关键词表达用户的网络使用需求。间接型数据是指在数据自身并没有直接反映消费需求,信息传播者在对相关数据进行分析的基础之上,对受众或者网民的需求特征进行研判。这类数据往往产生于社交媒体平台或者信息推荐类引擎之中。通过用户的人际交往特点、信息获取偏好,对消费者进行画像,将其标签化,进而实现信息的精准推送。
数据是对于网络使用者网络行走的记录,当其成为数据时,也必然伴随着一定的伦理风险。从数据的来源看,很多数据是在平台使用者不知情或者不情愿的条件下被获取的,同时,技术的发展使智能化获取用户的信息更为便捷,如各类摄像头、无人机或传感器等,用户在不知情的情况下,信息已被提取或收集。这种形式使得平台获取数据的正当性更受质疑。
从用户特征来看,通过数据对用户的日常生活进行勾勒和判断,继而实现信息的精准推送。而这一点,则是对用户“不被打扰”的权利的一种侵犯。
由此,对数据类型的分析意在明确网络用户与数据的关系。无论是网络平台还是数据挖掘公司,首先都存在着数据获取的道德性拷问,也就是获取数据的手段是否适宜。
(二)信息传播的“茧房”效应
与获取数据手段正当性相关的还有一个更为严重的伦理问题,这就是信息传播的“茧房效应”。“信息茧房”是随着智能化传播而产生的一种现象。在一般意义的传播范畴中,它是指人们讨论这种现象背后的技术逻辑所导致的用户信息阅读的自我封闭和窄化现象。平台往往利用这种“茧房”现象,进而实现其“茧房”效应,也就是根据对用户的阅读兴趣判断其生活方式,进而向其推送一定的产品信息。从形式上来看,这确实实现了对消费者的精准洞察和产品信息的精准投放。但是,作为用户(消费者)而言,是在一个狭窄的信息空间中接受这类信息。这就使网络平台与网络用户存在着一定的信息不对称问题。进而强化了信息传播备受诟病的“洗脑”和“控制”问题。
(三)数据管理与伦理风险
互联网是伴随着用户的网络使用而发展起来的,因此数据的形成逻辑为:个体的网络用户由于自身的需求形成网络行为,进而成为各类网络平台存储的客体。也就是说在数据的呈现样态中,个体用户贡献数据,网络平台积聚数据。随着算法应用的普遍性及其所体现的智能化倾向,当网络行为进入算法逻辑时,人们开始意识到许多网络平台的资本属性。因为数据作为算法的核心要素,其实就是用户自身的信息集合。这就涉及了伴随着互联网的发展一直存在的一个问题:用户的个人隐私。人工智能算法时代,使这个问题具有进一步的发展。从数据主体来看,是网络用户与网络平台之间的关系问题;从数据的维度来看,就是数据产生、获取与应用问题。其本质是消费者和资本之间的关系。在这样的情境中,问题的实质嬗变为资本是如何获取消费者的信息以及使用的方式和目的的问题。
三、权利与权力的重构:解决数据伦理问题的路径
(一)网络平台数据管理的正确价值观引导
由于基于算法的数据管理的技术属性,人们更多强调从技术层面讨论传播所存在的伦理问题。但是所有的技术问题最后都会回归为人的问题。智能技术所呈现的数据伦理的困境并不是无解的,其答案也非常明确。这就是数据管理中的价值观问题。
陈昌凤教授认为,作为未来传播发展的趋势,智能化的发展也会带来传播伦理的困境。这个问题如何解决,陈昌凤教授认为,智能算法技术的应用,应当具有正确的价值引导。“在进行人工智能价值观引导方面,可参考西方逆向工程学等学科类方法,打开内部的‘黑匣子’,了解其内部运作机理及价值观形成的错误节点,以进行正确的价值观引导”。[5]
(二)网络平台与网络用户关于数据的新契约思路
在智能传播时代,网络平台与用户应当形成关于“权利”与“权力”的新契约思路
“隐私”应当是在智能化时代传播所遭遇的重要伦理问题。就信息传播而言,客观地说,“隐私”并不是一个新鲜的话题。在任何技术条件下,都存在着获取用户信息手段的适宜性问题。但在当下的技术背景下,由于网络用户与网络平台之间的关系,关于“隐私”的认识也存在着一些新的变化。
毋庸置疑,在互联网时代,人们对于个人信息的管理也出现了一些新的变化。用户贡献数据,平台积聚数据,在互联网空间已成为常态。关于数据的获取与使用,在用户与平台之间,存在着新契约的基础。新契约应当建立在用户与平台之间关系的基础之上。平台能够为用户提供用户认为有价值的内容,在此基础之上,用户应当对个人信息的权利进行一定程度的让渡;而平台在为用户提供真实准确信息的基础之上,在用户授权的条件下,基于一定的社会责任而使用用户的数据。
(三)数据管理要进行严格的伦理风险评估
由于数据中存在的个人隐私的不确定性,在数据管理中,应当对数据的获取和应用过程进行严格的伦理评估。如果说在获取阶段的隐患更多涉及的是用户和平台之间关于“隐私”的边界的话,与之而来的一个相关的话题便是“打扰性”问题。“隐私”的实质是个人与公共的距离问题,因此导致的问题则是,即使数据获取的手段是适宜的、正当的,但用户是否愿意接受相关信息,是否愿意自己的社交或者阅读空间受到打扰?这些问题都应当作为网络平台首要进行的数据伦理考量。
参考文献:
[1]戴维·赫佐格.数据素养:数据使用者指南[M].沈浩,等,译.中国人民大学出版社,2018:4.
[2]戴维·赫佐格.数据素养:数据使用者指南[M].沈浩,等,译.中国人民大学出版社,2018.
[3]尤瑞恩·范登·霍温,等.信息技术与道德哲学[M].赵迎欢,等,译.科学出版社,2014:13.
[4]菲利普·帕特森,等.媒介伦理学:问题与案例[M].李青藜,译.北京:中国人民大学出版社,2006.
[5]陈昌凤.媒介伦理新挑战:智能化传播中的价值观赋予[J].新闻前哨,2018(12).
(作者为重庆大学新闻与传播学院硕士生)