从研究方法的角度来看,我们不难发现,是人类首先用 “不良” 数据误导了 AI,才使得 AI 将这种 “恶” 的人格在不同任务中进行泛化。由此可见,AI 最终是向善还是向恶,归根结底取决于人类如何去塑造它。这场正在席卷全球的 AI 革命,其核心关键并非单纯的技术问题,而在于人类赋予 AI 怎样的价值观和目标。当我们成功找到 AI 的 “善恶开关” 时,也就意味着我们掌握了与 AI 和谐共处、共同进步的主动权。让 AI 走向善的道路,依靠的不仅仅是先进的算法,更重要的是人类内心深处的善良与智慧。这或许正是辛顿等诸多 AI 领域大佬不断奔走呼吁的真正原因所在。 【原文链接:https://openai.com/index/emergent-misalignment/ 】