我自以为对AI的发展挺了解的,前几天OpenAI研究员姚顺雨在自己的网站发表了《AI下半场The Second Half》,无论是他对AI上半场的复盘,还是对下半场的预判[AI 上半场的“赢家”几乎都是提出新训练方法或模型;到了“下半场”,方法创新的边际收益正在下降,应转向“效用问题”(utility problem)],其深度和广度都远超我的认识。自己“觉得会”,不见得“真会”,甚至都不见得懂。
AI 素养本身是一个 多维度、复杂构念,涉及技术知识、伦理态度、社会意识等,不是单一知识测试。现有量表良莠不齐,需要一套标准化、跨领域认可的框架来“公平打分”。COSMIN 通过一套测量属性体系来评价量表质量,在医学、心理学等量表评估中已是“金标准”,具有高度权威性和适用性。以下是COSMIN关注的维度:
在这篇 AI 素养量表综述中,作者用 COSMIN 帮助我们判断:哪些表值得用,哪些还需要补充验证。