大数据时代的风险(大数据时代挑战)
教育数据:大数据时代教育的新挑战
当前,“信息技术对教育发展有革命性影响”已形成共识。近些年来,随着大数据技术的兴起与应用,教育正面临着全新的机遇与挑战,教育与大数据同行,将会为我们呈现科学化、精确化、智能化、个性化的美好教育图景。
2016年5月,《科学》报道了美国国家科学基金会(NSF)主任France Cordova 关于NFS 未来几十年的发展蓝图,更是将大数据支持下“开发和评价创新性的学习和教学机制方式”纳入其重点解决的科研前沿。但是,技术是把双刃剑,随着技术与教育融合的不断深化,基于来自教育场域中的数据而开展的科学决策、教育研究将成为新常态,基于数据的各类创新性教学服务将不断涌现。大数据在为教育带来巨大价值的同时,也孕育着我们无法预知的风险,由此可能引发一系列的社会问题和挑战。
教育是特殊的社会子系统,事关人的发展、国家和民族的未来,在技术快速演进、法律法规相对滞后的当下,尽快开展教育数据的系统研究,防范可能的风险,为教育的健康发展设置“看门人”,对大数据时代的教育尤显急迫而重要。
教育关系到人的发展和社会的运转,其涉及的数据类型纷繁复杂,其中最值得关注的数据有四大类:公共数据,也就是国家和各级政府在开展教育公共服务时,搜集、统计、累积而产生的一系列数据,其基本的特点是数据的搜集者和拥有者是各级各类政府机构;个体数据,也就是参与教育活动的个体,特别是学习者在学习过程中所生成、沉淀、累积下来的各类数据;研究数据,是指针对特定目的而开展的教育研究过程中所搜集的数据,特别是事关研究对象的各类敏感性数据;跨界数据,所有与教育有关、由其他领域所产生的各类数据。
不管是哪一类型的教育数据,均具有一致的生命循环特征:产生数据、采集数据、拥有数据和使用数据。
尽管数据是由比特(Bit)组成,是非物质的,但是数据已成为人类生产资料的重要组成部分,被喻为21世纪的石油,是当今第四种科学研究范式的核心研究对象。当前,大家关注和讨论的焦点是大数据。但是,从本质上讲,对于各行各业来说,数据本身最为重要,而不在于其为大数据(Big Data)还是小数据(Small Data),教育数据关注的是数据本身的客观价值。
长期以来,教育系统持续积累、汇聚了大量的各类数据,特别是量化学习运动将会带来数据的进一步迅猛增长,对于这些教育数据的持续收集、分析和应用,将有效促进教育创新,其对教育现在和未来的影响也是不可小觑的。
教育数据问题是技术促进教育变革进程中的必然产物,是教育的有机组成部分。教育数据是对教育数据产生、采集、存储和分析利用过程中所应秉持的道德信念和行为规范的理性审视,是大数据时代教育场域中有关道德重构的哲学研究。目前,“人—技”协同进化的教育发展态势日趋明显,需要教育数据来回答什么是对、什么是错,指出什么是应该提倡的、什么是应该摒弃的,引导技术与教育融合的进程和谐共进,杜绝技术异化而导致的对教育主体的桎梏,服务教育的本质要求,满足人的价值需要,助力人的全面发展。
对于技术裹挟下快速演变的教育系统,急需教育“看门人”为大数据时代教育的发展和演进掌舵,教育数据研究应义不容辞地承担起这个重要的时代使命。围绕数据驱动下的教育研究、应用与服务,确立普世的道德标准作为底线,制定适当的法律法规来约束相关方的行为,建构相应的框架并根植于大数据技术体系来防止技术研发、运用与服务过程中的异化,是教育数据在今天和未来相当长一段时间内的主要挑战和根本任务。
教育数据关注的核心是树立共同的道德信念,勾勒教育数据采集和使用过程中的关系与准则,追求教育效用的最大化。对于教育数据所面临的问题分析与讨论,可以遵循 VBTC分析框架,即基于价值、利益、时间、情境因素的分析框架。(见下图)
教育数据分析的出发点和落脚点就是围绕数据的利益相关方的价值冲突和利益冲突,所要解决的根本问题就是消除冲突、协调冲突、规避风险,开展主体与客体之间的价值协调、利益平衡,同时,由于认识的局限性和教育系统演进的动态性,必须考虑教育数据生命循环过程的时间和情境特征。只有综合考虑价值、利益、情境和时间等多重要素对教育数据进行设计,方能保障教育数据采集、研究、分析与应用的合理性、规范性和有效性。
(一)价值构建与认同是教育数据面临的根本挑战
教育数据关系学习者个体的发展和社会公众的共同福祉,其生产、采集、拥有与使用的每个环节均需我们深入思考,进行必要的道德拷问和法理梳理,引导社会大众走向价值趋同,消解教育数据生命循环过程中可能产生的歧义,促进教育数据价值一致性的构建和道德信念的树立。
教育数据价值构建的最大挑战来自于教育系统特性的本身:教育是服务于人的发展的,而这正是问题复杂性的根源。这种复杂性促使教育数据的分析和研究需要在两个思考维度上同时展开:既需要为教育数据设立普世道德原则的一阶逻辑思维,也需要善于开展时序化、情境化教育数据价值思考的二阶逻辑思维。当前,急需建构教育数据的研究与分析方法论,促进相关价值观的形成与认同。
(二)利益机制设计是解决教育数据问题的主要抓手
从数据生命循环的角度来看,教育数据的利益相关方基本上可以细分为四类:数据生产者、数据拥有者、数据搜集者和数据使用者,当然,它与现实中的利益主体不一定是一对一的关系,可以是多对一,也可以是多对多的关系。在很多时候,教育数据直面的就是各利益相关方的利益冲突,教育数据的主要任务就是平衡各方利益,提出相应的体制机制,使教育数据在运转过程中实现教育的效用最大化。
教育数据中的利益机制设计不仅仅是一个经济问题,更重要的也是首当其冲的是一个教育问题。在利益机制设计中,教育价值的遵从是最基本的要求,教育规律的适切是最基本的原则。教育数据中讨论的相关的利益是多元的:教育的、社会的、经济的、个人的,等等,其对应的利益主体也可能是国家、家庭、个人、某个特定组织等多方的,这些利益的考量和利益主体的互动将在时间 和空间的约束下呈现出复杂的图景,需要加 以精心设计、规范和引导。
(三)时序性和情境化蕴含教育数据的动态性
时序性和情境化是教育的基本特征,教育场域中所产生的数据具有天然的时间特性和情境内涵。因此,时间和情境,是教育数据分析和研究的参考原点。
时间和情境在很多时候可能是我们回答相关问题的关键(如,某种类型的教育数据是否应该被采集?是否应该被永久保存?应该被谁所拥有?是否应该被公开?等等),会直接影响到教育数据的价值和可用性(如,用某个人现在的教育数据来预测其人生的未来一定正确吗?某个人的小学成绩数据对于大学的他或她还有意义吗?等等),也可能会影响相关机制体制的设计(如,谁应该对教育场域中的历史数据的丢失负责?谁对特定时间和情境下的教育数据拥有什么样的责、权、利?等等)。时序性和情境化的特征决定了教育数据的动态性,需要我们以发展的眼光积极地面对。
全面完善的教育数据体系的建立需要包括教育主管部门、学界在内的全社会的共同努力,相关的价值趋同与法律法规的建立也需要相当长的时间。但是,目前技术与教育的融合进程正在快速推进,教育对大数据的拥抱也表现出极大的热情,对数据驱动下的教育创新充满期待,因此有必要加强对当前教育数据中面临的一些基本问题的讨论,这将有助于提供方向性的指引,从而为教育的发展保驾护航。
作为由物理世界向网络世界延伸与拓展中面临的挑战,教育数据大厦的构建要基于传统的发展脉络与理论体系,首先需要回答人们关心的基本问题,奠定教育数据的逻辑起点。从互联网+教育场域构建的迫切性来看,教育数据目前急需从价值、权利、行为三个层面来回答三个基本问题。
(一)教育数据的价值定位
正如康德主义和美德学所一直关注的那样,任何学都需要首先回答什么是对的、什么是不对的,也就是价值定位。有关教育数据对教育核心价值的讨论,是我们通向构建教育数据理论体系的起点,而教育数据核心价值定位的明确,更是构建教育数据大厦的逻辑原点。
大数据的核心价值是什么?舍恩伯格说是“预测”。诚然,数据特别是海量数据蕴含有丰富的信息,可以为人们提供了解未来发展趋势的可能,但是,“预测”的价值定位有可能引导人们走向数据决定论,容易出现“贴标签”效应,比如,某个学生一定学不好、不宜于考大学、会成为一个坏人等,这对于教育来说,其后果可能是灾难性的,将背离育人的基本内涵。
对于教育来说,尽管数据一样能够提供预测服务,但是,教育数据为教育带来的最大价值不是预测,而是对教育本身的“洞察”:它让教师有机会深度观察自身的教学行为和每 位学生的真实状态,使科学调整教学模式、实施个性化教学成为现实;它让学习者具备了自我审视的能力,使全方位了解自己、开展自我精准调整、实现高效学习成为可能;它让教育管理者能精准、及时把握教育系统的要素(特别是教师和学生),为教育管理决策提供科学的依据,为采取相应的措施提供合理的理由。“洞察”的价值定位的本质是数据服务论,它可助力教育向因材施教、个性化学习的目标高速迈进。
(二)教育主体的数据权利
互联网教育作为一个全新的教育场景和生态,急需类似社会契约论方面的理论引导, 制定教育数据采集与使用过程中应共同遵守的契约。而契约的核心是权利,也就是教育数据权利。教育主体数据权利的清晰界定,是构建大数据时代规范场的基石。
随着技术的快速进展及其与教育的深度融合,针对教育场景的量化将愈来愈方便、越来越彻底,人们将史无前例地拥有全方位深度观察教师和学习者的能力,特别是对学习者进行数据化构建成为可能,学习者愈发透明化。这种深度“洞察”为我们的教育研究和教育服务带来巨大价值的同时,也蕴含着对教育参与主体,特别是学习者隐私泄露的风险,而且教育数据的收集、使用越充分,所带来的危害可能越大。因此,对教育数据采集与使用过程中教育主体数据权利的界定尤显重要,轻则漠视教育主体的隐私,重则影响整个教育生态体系的健康循环。
对学习者来说,隐私权的侵犯将会危及学习权、发展权乃至身心健康与人身安全。任何公共教育数据的公开与共享,都要尽量避免涉及学习主体个人的细致信息以及区域、种族差异论;任何教育研究数据的发表、发布都必须对被试对象的信息进行脱敏,并要保证数据的客观性;任何学习对象对在享受学习服务过程中产生、搜集、存储与自身有关的数据都要享有知情权,并且相关数据需要得到有效的保护,在获得学习者授权的情况下方可合理使用。
(三)教育数据的教育效用
从行为功利主义和规则功利主义来看, 所有围绕教育数据所展开的行为均应服务于教育效用的最大化。基于教育本身的特点,教育数据易被打着教育或研究的旗号,在收集与使用过程中偏离于其本来的目的,这既有教育效用测度的模糊性的原因,更有人为地对教育效用的故意扭曲的可能。深度厘清教育效用,是有效指导互联网教育场域中主客体行为的基本前提。
教育数据的教育效用主要体现为教育数据采集与使用过程中价值与利益的权衡,有关针对教育数据本身的价值认识和教育数据 服务过程中所产生的利益冲突,也是教育数据所面临的主要矛盾。价值趋同和冲突消解也就成为教育数据的核心追求。教育数据服务对象具有多元化和高度个性化特征,如何促进教育效用的优化,需要深入的讨论和全社会的共同努力,任务艰巨。与此同时,教育数据服务兼具社会效益和经济效益,涉及的相关利益主体复杂多变,服务过程又具有时序性和情境化特征,相关利益机制的设计也超越了单纯的经济利益机制,需要尽早展开有针对性的研究,以保障教育数据所发挥的效用最大化。
(一)传统学视角:推进道德自律、法律法规与监管
传统学无论是从基本原则层面(如安全原则、公平原则、优先原则、知情同意原则等),还是从专门范畴的讨论层面(如制度学、责任学、功利学、美德学 等),都 为教育数据的研究指出了恰当的遵循基础和努力方向。
教育数据的当务之急是要建立基本的准则,避免道德失范,推进所有利益相关方的道德自律;推动有关教育数据的法律、法规建设,防止法律缺位,约束所有利益相关方的行为;完善相关制度建设,提倡教育数据 服务过程的监管,促使教育数据服务合理、合 法、合规并高效。
(二)技术视角:避免技术异化
“ 技术无好坏,亦非中立”。技术可能由于技术的发明人而带有与生俱来的偏见性(如“周边定律”:将特定的技术或算法天然地 植入用户设备中),也 有可能由于某种特定的使用方式而形成“过滤气泡”效应,进而对人的行为进行调节和限制,一旦这些行为与服务对象的意愿相违背,问题将不可避免地产生。
对于教育数据来说,技术的拥有者和使用者可能利用“周边定律”来量化学习者的行为、采集特定的数据而不为学习者所知,大量收集、存储广大学习者的各种数据从而形成数据垄断,设计特定的算法出于不为我们所知的目的来挖掘和分析教育数据,而这些不恰当的价值判断和利益驱动下的技术异化是促使教育数据问题尖锐化的重要物质推手。
对于教育来说,我们不仅仅要求技术的发明人、制作者、拥有者和使用者能够进行道德自律,更要建立尽可能完备的框架,并要强力介入教育数据服务的各个环节中,形成渗透效应,以有效约束和规范技术的使用,避免技术的异化。
(三)教育视角:提升教育数据素养
教育领域对大数据技术的热情期待和拥 抱,是信息技术与教育融合发展到新阶段的必然产物,教育数据的大量积累和使用将加快教育创新的速度、拓展教育创新的深度和延伸教育创新的广度。从这个意义上来讲, 教育数据已是教育生产力的重要组成部分,充分发掘、运用好教育数据生产力,对教育改革和发展意义重大。
从教育实践的角度来看,推动教育数据生产力的关键要素是一线的教育管理者和教师,应该在强调信息技术素养的基础上更加旗帜鲜明地提出“教育数据素养”,培养他们的数据意识和善于搜集数据、科学分析数据、合理使用数据、实施精准教育教学服务的能力。教育数据素养的提升将为数据驱动下的教育进步提供必要的保障。
教育数据及其相关技术与应用服务为教育创新发展提供了新引擎,也隐含着毁灭任何一个学习个体的危险。尽管教育数据才刚刚为我们带来教育创新的曙光,但是相对于其他社会子系统来说,教育系统更需要超前部署、未雨绸缪。对教育数据的求索,是对大数据时代教育规范场的建构,有效促进技术与教育的深度融合,才能让科学技术的发展更好地惠及并推动教育的进步。教育数据的有效建立,将会为新一轮教育的改革和发展夯定更加坚实的基础,引领技术与人文统一迈向新高度。
* 作者简介: 刘三女牙,华中师范大学国家数字化学习工程技术研究中心常务副主任、教授、博士生导师;杨宗凯,华中师范大学校长,国家数字化学习工程技术研究中心主任、教授、博士生导师;李卿,华中师范大学国家数字化学习工程技术研究中心讲师
本文系教育部—中国移动科研基金项目“国家教育大数据相关问题研究”(项目编号:MCM20160401)的阶段性研究成果。
本文转载自微信公众号“教育研究微刊”,来源于《教育研究》2017年第4期(总第447期)。文章为作者独立观点,不代表芥末堆立场,转载请联系原作者。
积极应对大数据问题
近年来,基于互联网、云计算等的数据挖掘技术日益成为社会发展的重要推动力量,在应对复杂局势、制定科学决策、提供优质服务等方面表现出前所未有的独特优势,这使得大数据的重要性越发突显。与此同时,大数据相关技术的发展与应用,也在隐私保护、数据中立、数字鸿沟等方面带来了一些新的问题。积极应对大数据问题,使相关技术的道德意义实现良性循环,从而促进人类整体福祉的发展,是我们对大数据进行反思的关键。
把握具体问题
大数据相关技术在提高生产生活效率的同时,也使整个社会被快速数据化。而在对数据的生产、收集、挖掘、使用等过程中,一系列大数据问题也随之而来。
一是隐私保护问题。大数据面临的一大困境是,相关技术在政治、经济、文化、社会、生态等各个领域的应用,要以开放共享为基本理念和规则,而这同时也带来了个人隐私及安全保护方面的难题。从学的角度讲,隐私即在私人生活中的不愿诉诸公众社会或为非所意愿的他人知悉、干预的情况和事态。由此可见,个人隐私主要涉及私人领域与公众领域之间的界限划分问题。在大数据的背景下,个人信息的收集和处理是隐私问题的两个主要方面。在个人信息收集方面,隐私风险的产生主要来自视频监控、网络监控等对个体行为的实时监控,而这主要是因为监控对个人信息的收集过程往往是不为被监控个体所知道的。比如,学校、医院、政府、企业等通过各种平台收集的学生、病人、公民、消费者等的各种数据,是否侵犯了他们的个人隐私?此外,对海量碎片化的个人信息进行积聚、对比、分析等处理,也有可能造成对个人隐私的威胁和伤害。原本各种分离、无关的小数据,经过加工、重组、编辑等一系列处理过程,其自身价值会产生从量变到质变的重要变化,同时其组合构成的大数据也可以描绘出个人的特性、身份、习惯等,而这里就很可能有人们并不想公开的个人隐私信息。
二是数据中立问题。数据是可以由人工或自动化手段进行处理的那些事实、概念和指示的表示形式,是进行各种计算、研究或设计所依据的数值,包括数字、字符、符号、图表等。大数据本身虽是客观中立的,但在数据处理及使用中也可能会产生非中立的结果,而这主要是因为在此过程中存在着各种人为主观因素。在全球数据爆炸性增长的今天,正是由于人们在运用技术的过程中有所偏差,才会导致算法歧视等问题不断出现。比如,算法推荐随着大数据与人工智能的迅猛发展而日益成熟,但也不可避免地带来了偏见与歧视的问题。在现实生活中,像一些网上购物平台中的“推荐”页面或赠送“红包”“优惠券”等,通常都是通过个性化推荐算法得到的。从本质上看,算法设计是具有目的性和价值观的,它体现的是设计主体的意图和选择。因此,算法基于对个体的贫富差距、性别差异、健康状况等信息的全面掌握,可以个性化、差异性地推荐相关产品或服务,但也会导致不同群体之间在信息掌握层面的不公平,甚至出现“大数据杀熟”等算法歧视现象。
三是数字鸿沟问题。数字鸿沟是数字化时代产生的一种新的社会公平问题。传统意义上的数字鸿沟,主要是指人们在数据可及、数据应用、数据分析等方面存在着使用数字技术的巨大差异,表现为一部分群体能够较好获取和使用数字技术,但另一部分群体则很难获取和使用数字技术。数字鸿沟产生的数字技术资源分配不平衡问题,会逐步引起群体矛盾和社会不公。在大数据背景下,随着移动互联网的普及,数字鸿沟以及由此造成的社会公平问题,不再主要表现在数字技术的可及和应用方面,而是日益演变为数据鸿沟,并集中表现为由知识、技术、经济等因素导致的技能鸿沟、价值鸿沟等。一些政府部门、企业、科研机构等,能够较为容易地获得和使用数据,通过对数据的挖掘、计算、存储、传送等掌握社会中的个体行为,而普通民众则很难获得庞大的高质量数据。再者,即使民众成功获取了大量的高质量数据,也有很多人并不具备分析各类复杂数据的技能。由此,这里的数字鸿沟将越来越大,在数据获得、技术应用和价值区隔等方面出现了不公平的问题。
探索应对之策
面对大数据带来的难题,我们应积极采取有效管理措施,确立相应原则,以寻求各种挑战与难题的应对之策。
一是加强数据管理。对大数据相关技术的管理,不是简单对技术从业人员的约束与监管,而是需要进行多层面、全方位的系统化管理。首先,应加强对数据使用者的管理。要加强数据使用者对大数据相关技术知识的学习,使其在深刻领会的基础上应用。要提高其个人隐私保护观念,防止出现个人隐私泄露,并使其学会依法维护个人正当权益。要对其加强数据教育,全面提高其职业道德水平。其次,应加强对技术的控制管理。由于海量数据在收集、处理、分析等过程中都有可能出现隐私侵犯问题,所以既要加强对个人信息收集及存储环节的隐私保护,又要采用有效合理手段限制数据分析和非法传输,还要加强信息安全技术对隐私安全的保护。实际上,解决大数据带来的隐私保护问题的根本方法,就是推动技术不断发展与进步。最后,应加强对数据环境的监督管理。要坚持德法并举,为大数据的发展提供良好的法律法规和制度环境,强化数据使用者的内在自我约束。要坚持全民参与,构建完善的监督体系,充分发挥举报制度在打击违法犯罪行为中的积极效用,从而维护良好的数据生态环境。
二是注重以人为本。马克思主义哲学指出,人是社会的主体,人所追求的社会进步归根到底在于人本身的发展。2022年3月,中央办公厅、国务院办公厅印发的《关于加强科技治理的意见》明确将“增进人类福祉”作为科技的第一条原则,强调“科技活动应坚持以人民为中心的发展思想”。大数据相关技术的发展,应始终贯彻落实科学发展观,坚持以人为本的原则,以提高人民的生活质量和促进人的全面发展为目标。大数据作为现代科技手段,其不断发展进步的意义和目的不在于技术本身,而在于更好地服务于人的生存与发展。马克思强调,“只有当对象对人来说成为人的对象或者说成为对象性的人的时候,人才不致在自己的对象里面丧失自身”。我们只有始终把人作为主体性的存在,把技术作为对象性的存在,才能确立人在大数据相关技术开发应用过程中的主体地位,形成以人为中心的价值取向。坚持以人为本,要让广大人民群众共享科技发展成果,积极引导科技向善,增进人类的整体福祉;要尊重个人隐私,保障广大人民群众的合法权益;要公平正义地对待不同社会群体,避免歧视与偏见。
三是秉持价值理性高于工具理性的原则。工具理性是法兰克福学派代表人物霍克海默(Max Horkheimer)和阿道尔诺(Theodor Adorno)提出的一个重要概念,亦称技术理性。随着科学技术的不断发展,人类理性作为纯粹的科学技术研究方法,由于自身的辩证发展而变成为了达到实用目的的手段和奴役人的工具。工具理性代表着可怕的科学技术统治,会扼类理性的主体性和创造性。它所主导的思维和行动方式,考虑的是效用和效率,而往往不会去考虑道德上的善恶问题。与工具理性不同,价值理性本身蕴含着价值判断的内容,看重的是主体的内在需要以及行为本身的价值,而不是行动的结果。工具理性讲求效率和效能,更多关注的是人类的物质欲求;价值理性则追求人类在实践活动中的价值智慧与价值良知。虽然在社会现代化进程中,人们面临着工具理性崇拜、价值理性边缘化的问题,但实际上工具理性和价值理性并不是绝对对立的,而是相互依存、相互促进的关系。工具理性为人类实现价值理性提供智力支持,价值理性为工具理性提供精神动力,两者辩证地统一于人类的生产实践活动中。在大数据背景下,我们应在继续重视工具理性的同时,不断弘扬价值理性,充分发挥价值理性对工具理性的引领作用,以促进社会更好的进步和人的全面发展。
(作者单位:南京大学哲学系、智能哲学与人类未来发展研究中心)
来源:中国社会科学网-中国社会科学报 作者:李文涛