人工智能时代的数据素养:重构公民 能力与抵抗性素养

  • A-
  • A+
2026/03/31 10:36

胡  泳

【摘要】在人工智能深度渗透的社会背景下,传统以技能为核心的数据素养概念已无法满足AI时代的公民要求。本文从技术、批判、伦理与实践四个维度重新审视数据素养,强调其不仅是操作与分析数据的能力,更是一种社会—伦理素养。论文指出,AI时代真正的数据素养是一种“抵抗的素养”,旨在让个体在被算法塑造的环境中保持主动性、批判力与公民责任感,从而有效参与算法治理与社会决策。本文也呼吁数据教育从单纯技术训练转向批判与伦理并重的综合培养,以应对数据化社会的权力与治理挑战。

【关键词】数据素养;算法素养;公民能力;社会—伦理素养;抵抗素养

一、数据素养的再激活

在这个数据密集型的世界里,具备“数据素养” (data literacy)非常重要。关于数据素养的定义与结构,学界已有较成熟的研究成果。Wolff 等(2016) 将数据素养定义为“通过探究过程,利用大规模或小规模数据集,识别和回答现实世界问题的能力,同时考虑数据的伦理使用”。这一定义强调对数据收集、清洗、分析、可视化、解读与运用的综合能力。最近,一项面向高校和研究机构构建的数据素养能力模型,将数据素养分为多个维度,包括建立数据文化、提供数据、管理数据、分析数据、评估数据、解释数据以及发布 / 交流数据(Echtenbruck et al,2025)。

然而,当数据成为复杂社会系统(包括平台、算法、AI 模型)的基础设施时,仅有数据读写能力显然不够。近年来,算法素养(algorithmic literacy)或人工智能素养(AI literacy)的研究开始兴起。国内研究指出,在数智时代,算法社会要求个人具备三维素养结构:知识层、思维层和态度层,以应对算法带来的社会风险(如偏见、歧视、数据隐私、决策不透明等〈夏苏迪等,2023〉)。

国外有学者提出“批判性数据素养”(critical data literacy)的概念,认为其能够促进对数据实践的批判,将数据置于平台、网络基础设施和社会的背景中加以理解,并在统计和数学论证之外发现数据的意义(Acker et al,2024)。Kaplan & Meylani(2025)将人工智能素养定义为个体理解、使用、评估和反思人工智能系统的能力,不仅包括技术操作技能,还涵盖伦理、社会和认知维度。人工智能素养不仅是工具使用能力,更是公民在算法化环境中保持自主性与批判力的能力。

与此同时,有关算法决策正当性、公平性以及透明性的批判文献也不断增加。研究者指出,当算法用于重要人生决策(贷款审批、招聘、保险、司法再犯预测等)时,若不具备透明性与问责机制,个体将陷入被动(被评分、被分类、被预测)而难以申诉(Binns et al,2018)。对此,一些教育工作者和社会科学家主张,在数据 / 人工智能素养教育中应融入伦理、公正、隐私与治理等议题 (Louie et al,2023)。

本文认为,数据素养是指个体、组织或群体在多种情境中有效识别、获取、创建、理解、分析、评估、管理、使用与交流数据的综合能力。其核心并不仅仅是操作和处理数据的技术能力,更涉及认知、解释与行动能力乃至在数据的收集、分析与应用过程中所体现的伦理、责任与价值判断,是数字社会中的关键公民能力(critical civic competence)。

在这个定义当中的认知,指的是如何理解数据;解释,意味着如何从数据中生成意义;行动,就是要基于数据作出判断与决策。同时,数据素养还内嵌着一整套伦理与社会责任框架 , 包括对数据来源的敏感性、对算法偏差与结构性不平等的识别能力,以及对数据使用可能带来的社会后果的反思能力。换言之,数据素养不仅教人“如何用数据”,更教人“如何善用数据”,以及“在什么背景下限制自己使用数据”。

过去我们理解的数据素养概念是狭义的,多指个人在信息社会中对数据的获取、分析和运用,即“能读懂数据,会用数据”。这一框架源于 20 世纪末的企业信息化与信息社会研究范式,其核心关注的是个人的信息处理技能——如何搜集数据、如何运用统计工具、如何将数据转化为可操作的信息。比如,数据可视化曾经是数据素养的重要组成部分。随着可视化工具在传统媒体、社交媒体和技术报告中得到越来越广泛的应用,工作者不仅要正确地阅读它们,还要批判性地思考它们,并意识到它们可能会被滥用。所以,传统数据教育十分关注统计图表与信息可视化。

然而,这种以技能为中心的狭义理解隐含了两个重要前提:一是数据被视为稳定、客观且中性的资源;二是数据的使用情境主要局限于工作场景或教育场域中的理性决策任务。因此,它忽略了数据在平台化社会中的流动性、权力性与社会性,也无法充分回应算法治理时代中日益凸显的结构性风险。

当人工智能以算法推荐、生成模型和自动决策的形式深度介入社会生活时,这一数据素养的传统定义已显得过于狭隘。数据如今不仅是信息资源,更是算法训练的燃料、社会控制的媒介以及人机互动的基础结构,甚至是资本积累的新形式。算法通过看似中立的逻辑,选择性地呈现世界,从而重构了人们的注意力与信任机制。人们往往相信“数据不会说谎”,却容易忽视数据选择与建模背后的社会偏见。为此,进入人工智能全面渗透的时代,数据素养这一概念需要被重新激活。当数据已然从一种资源转化为一种影响社会结构、认知方式与权力关系的新型基础设施之时,数据素养的内涵必须相应扩展,涵盖对数据生成逻辑、模型推理机制、算法偏差来源以及数据化世界背后权力运作的洞察.....(本文为文章截选,完整版请搜索公众号:“教育传媒研究杂志社”)