OpenAI 正在资助一项「人工智能道德」的学术研究-麦子文章

OpenAI 正在资助学术研究，探索能够预测人类道德判断的算法。

根据向美国国税局（IRS）提交的文件，OpenAI Inc.（OpenAI 的非营利机构）披露，它向杜克大学研究人员提供了一笔资助，用于一个名为「研究 AI 道德」的项目。根据一份新闻稿，这笔资助是一个更大规模的三年期项目的一部分，总金额为 100 万美元，旨在支持杜克大学教授研究「构建道德 AI」。

关于 OpenAI 资助的这项「道德」研究，目前公开的信息很少。已知该资助将持续到 2025 年。杜克大学的实用伦理学教授、项目首席研究员沃尔特·西诺特-阿姆斯特朗（Walter Sinnott-Armstrong）通过电子邮件告诉《TechCrunch》，他「无法谈论」这项研究内容。

西诺特-阿姆斯特朗和该项目的共同研究员贾娜·博格（Jana Borg）发表了多篇关于 AI 在道德指导方面潜力的研究，并合著了一本书。他们曾参与开发一种「道德对齐」算法，用于帮助决定肾脏移植接受者，并研究了人们在何种情况下更愿意让 AI 做出道德决策。

根据新闻稿，OpenAI 资助的研究目标是训练算法，在医学、法律和商业等领域，预测人类在「涉及道德相关特征冲突」的情境下的道德判断。

然而，像道德这样复杂的概念是否能被当今技术所掌握，仍然存在很大争议。

2021 年，非营利机构艾伦人工智能研究所开发了一种名为 Ask Delphi 的工具，旨在提供符合伦理的建议。它在处理基本道德困境方面表现尚可，例如能够「知道」作弊是错误的。但只需稍微改写问题，Delphi 就可能认可几乎任何行为，包括窒息婴儿。

这与现代 AI 系统的工作原理有关。

机器学习模型本质上是统计工具。通过对来自网络的大量数据样本进行训练，它们学习这些样本中的模式，并据此作出预测。然而，AI 并不具备对伦理概念的真正理解，也无法掌握影响道德决策的推理和情感。

这导致 AI 往往反映发达国家的价值观，因为网络内容和训练数据主要由这些视角主导。因此，AI 的回答并不能反映许多人的价值观，特别是那些未通过网络表达的人群。此外，AI 还会吸收多种偏见。例如，Delphi 认为异性恋比同性恋更「道德可接受」。

OpenAI 及其资助的研究团队面临的挑战在于，道德具有极大的主观性。哲学家们数千年来一直在争论各种伦理理论的优劣，至今没有普遍适用的框架。

Claude 倾向于康德主义（注重绝对道德规则），而 ChatGPT 稍微偏向于功利主义（优先考虑最大多数人的最大利益）。究竟哪种更优越？答案因人而异。

要开发出能够预测人类道德判断的算法，需要综合考虑这些因素。这是一个极高的挑战——即使假设这样的算法能够实现。

但如果能做到这一点，其影响可能是深远的，它将影响我们如何在道德决策中信任机器。目前，世界可能要等到 2025 年，也就是这项基金结束时，才能知道这个「人工智能道德」项目是否取得了突破性进展。