我爱免费 发表于 2025-8-14 21:55

AI厌恶还是AI欣赏?基于能力-个性化框架的元分析综述

作者:微信文章


点击蓝字 关注我们



摘要

人工智能(AI)正在改变人类生活。尽管一些研究发现人们更倾向于人类而非AI(即“AI厌恶”),但其他研究却得出了相反的结论(即“AI欣赏”)。

为了调和这些矛盾发现,我们提出了“能力-个性化框架”。该理论框架认为,个体在特定情境中决定依赖AI还是人类时,会关注两个维度:(a) AI的感知能力(perceived capability of AI);(b) 情境中对个性化的需求(perceived necessity for personalization.)。

我们的研究表明,当AI被认为比人类更具能力且个性化需求被认为不必要(即“能力高-个性化需求低”)时,会出现AI欣赏(效应量d=0.27);否则会出现AI厌恶(d=-0.50)。通过一项涵盖163项研究(N=82,078)的元分析,我们验证了这一框架,并发现AI欣赏在实体机器人(vs.无形算法)、态度(vs.行为)结果、被试间设计(vs.被试内设计)以及低失业率国家中更为显著,而AI厌恶在教育水平和互联网使用率较高的国家中更为明显。这一综合框架为理解人机偏好提供了理论支持,并为AI开发者和用户提供了实践启示。

TOP 01一、研究背景


随着AI技术的快速发展,其在医疗、人力资源、金融等领域的应用日益广泛。然而,公众对AI的态度存在显著分歧:部分研究表明人们更信任人类决策(如医疗诊断或招聘),而另一些研究则发现AI在某些任务(如数据分析或游戏)中更受青睐。

这种矛盾现象引发了学术界的关注,但现有研究多从单一学科(如经济学、哲学或信息科学)出发,缺乏统一的理论框架。此外,此前综述多聚焦特定领域(如医疗或教育),未能跨领域整合AI厌恶与欣赏的机制。因此,本研究旨在提出一个普适性框架,系统解释人机偏好的边界条件。

TOP 02二、主要内容结构


双维度理论框架构建

本研究提出的"能力-个性化框架"(Capability-Personalization Framework)建立在多个理论基础之上:

功能态度理论(Functional Theories of Attitudes):

该理论认为态度服务于个体的特定需求(Eagly & Chaiken, 1993)

在AI情境下,能力维度满足实用需求(任务完成),个性化维度满足心理需求(被认可为独特个体)

独特性需求理论(Need for Uniqueness):

Snyder和Fromkin(1980)提出人类有保持独特性的基本需求

这解释了为何在高个性化需求情境中,即使AI能力更强,人们仍偏好人类


维度

定义

理论依据

感知能力

AI在特定任务中相比人类的能力优势

功能态度理论(Eagly & Chaiken, 1993)

个性化需求

决策是否需要考虑个体独特性

独特性需求理论(Snyder & Fromkin, 1980)


基于功能态度理论(Katz, 1960),提出创新性的"能力-个性化"二维模型:

l 能力维度:解决功利性需求(任务完成效率)

l 个性化维度:满足心理性需求(独特性认同)

通过13名编码员对93个决策场景的独立评估(rwg=.89),将情境划分为四象限:

l 高能力+低个性化:AI欣赏(如如股票预测、艺术品鉴定)

l 高能力+高个性化:AI厌恶(如医疗诊断)

l 低能力+高个性化:AI厌恶(如恋爱建议)

l 低能力+低个性化:AI厌恶(如实验室操作)



基于AI厌恶与AI欣赏的能力-个性化框架的四个象限

TOP 03三、研究方法


本研究采用系统性文献检索与元分析方法,整合了163项研究(共442个效应量,N=82,078),以验证“能力-个性化框架”对AI厌恶与AI欣赏的解释力。具体步骤如下:
(1)文献检索与筛选

数据库与关键词:

检索了Web of Science、APA PsycInfo、IEEE Xplore、ACM Digital、Engineering Village等数据库,并结合Google Scholar补充。

关键词组合包括:

AI相关(“artificial intelligence”“algorithm”“robot”等)

人类对比(“human”“people”“person”等)

偏好评估(“prefer”“trust”“fair”等)

筛选流程:

初步检索得到9,089篇文献,剔除重复后剩余7,394篇。

基于PRISMA 2020标准,最终纳入83篇论文(163项研究)。



排除标准:

未直接比较AI与人类决策的研究(如仅探讨AI特性)。

未提供可计算效应量的数据(如仅定性分析)。

(2)变量编码与评估

AI能力:13名独立编码者评估各决策情境下“AI是否比人类更有能力”(1=远低于人类,6=远高于人类)。

个性化需求:评估“该情境是否需要个性化考量”(1=完全不必要,6=非常必要)。

一致性检验:

编码者间一致性(rwg)均高于0.85,表明评分高度可靠。

最终以3.5分(6分量表中点)作为划分高/低能力与个性化需求的标准。
(3)统计分析方法

效应量计算:

所有结果统一转换为Cohen’s d(正值=AI偏好,负值=人类偏好)。

采用随机效应模型(考虑研究间异质性),并使用稳健方差估计(RVE)处理多重效应量依赖问题。

调节变量分析:

考察AI特性(实体机器人vs.算法)、研究设计(行为vs.态度测量)、国家特征(失业率、教育水平等)的影响。

采用Johnson & Huedo-Medina(2011)的移动常数技术可视化调节效应。

出版偏倚检验:

通过漏斗图、Egger检验、PET-PEESE回归验证,未发现显著偏倚。




TOP 04四、主要发现与结论

(1)核心发现

AI欣赏(d=0.27)仅出现在高能力+低个性化需求情境(如数据分析、棋类游戏),说明AI的客观优势需结合低情感需求才能被接受。

AI厌恶(d=-0.50)在其他三种情境中均显著,尤其是高个性化需求领域(如医疗诊断、招聘),即使AI能力更强(如皮肤癌识别准确率90.2% vs. 医生77.5%)。

(2)调节效应

AI形态:实体机器人(如服务机器人)比无形算法(如诊断软件)更易获得信任(d差异=0.53),因其具身性增强社会存在感。

测量方式:态度测量(如“信任度”)比行为测量(如“实际使用”)更敏感,反映用户对AI的认知-行为差距。

国家差异:

高失业率国家AI欣赏较弱(经济威胁感知抑制接受度)。

高教育水平国家AI厌恶更强(可能因对个性化需求更敏感)。


调节变量

AI欣赏增强条件

AI厌恶增强条件

AI形态

实体机器人(vs. 无形算法)

无显著影响

测量方式

态度指标(vs. 行为指标)

无显著影响

国家特征

低失业率国家

高教育水平 & 高互联网使用国家


(3)理论贡献

首次提出双维度框架,弥合了经济学(关注能力)、哲学(关注伦理)与信息科学(关注效用)的分歧。

证明个性化需求独立于能力(r=-0.29),挑战了“技术优势必然导致接受”的假设。

(4)实践启示

对开发者:

在低个性化任务(如物流调度)优先部署AI,或通过可解释性设计(如透明决策逻辑)降低厌恶。

通过拟人化交互(如机器人眼神接触)提升情感接受度。

对政策制定者:

在高失业地区需配套就业保障政策,缓解AI替代焦虑。

(5)局限与未来方向

数据时效性:所有研究发表于ChatGPT(2022年)之前,未来需检验生成式AI的影响。

文化差异:样本多来自欧美(WEIRD国家),需扩展至非西方语境。

动态能力感知:AI技术迭代可能改变用户的能力评估,需纵向追踪。

文献来源:Qin X, Zhou X, Chen C, Wu D, Zhou H, Dong X, Cao L, Lu JG. AI aversion or appreciation? A capability-personalization framework and a meta-analytic review. Psychol Bull. 2025 May;151(5):580-599.







营销观察站
页: [1]
查看完整版本: AI厌恶还是AI欣赏?基于能力-个性化框架的元分析综述