圣诞马拉松的第一天,OpenAI 对外发布了 o1 pro。近乎全网都震惊于 o1 pro 高达博士水平的数学、科学、编程能力。最近,OpenAI 总裁 Greg Brockman 在 X 上转发了世界顶尖免疫学专家 Derya Unutmaz 的帖子。这位专家分享了他与 o1 pro 的一次合作经历,他让 o1 pro 批判性地评估了自己和学生写的一篇关于一种特定免疫细胞 —— 粘膜相关不变 T 细胞(MAIT 细胞)及其在癌症中作用的综述文章。让他感到震惊的是,o1 pro 在这个领域的洞察比他还要深刻 ——Derya 是全球为数不多的顶尖专家之一,曾做出过一些关键性发现。他还提到,虽然他曾测试过 o1 和 Gemini Advanced 模型,它们也都非常优秀,但与 o1 pro 相比,还是差了一截。Greg 转发了这条长帖,并说道:「推理型 AI 提供了有价值的反馈和洞察,帮助全球专家解决科学问题,并有潜力改善每个人的生活质量。」
除了搞数理化很厉害,o1 pro 的人文社科能力也不差。OpenAI 营销研究员 Kay Sorin 亲自演示了 o1 pro 处理人文研究的能力,其效果远超 4o 或 o1。
世界顶尖免疫学专家 Derya Unutmaz 将他和他学生撰写的、关于黏膜相关恒定 T(MAIT)细胞及其在癌症中的作用的综述文章发给 o1 pro,并请它进行批判性的评估。
在看到结果之后,Derya 被 o1 pro 的反馈深深震撼,认为它的洞察力比自己还要深刻。这个说法可不简单,毕竟他本人不仅是这个领域为数不多的顶尖专家之一,而且还作出过一些关键性的发现。
Derya 谈道:「当我阅读它的反馈时,我发现自己盯着电脑屏幕,目不转睛,心中充满了混合的情感:难以置信、敬畏、喜悦和深深的谦逊。它提出的每一个观点,每一个问题,所有的一切都异常深刻!」他惊叹道,若 o3 还更为出色,那将意味着什么?生物学的进步将比他想象中的更为迅猛。Derya 进一步指出,他曾测试过 o1 和 Gemini Advanced,这些模型也都非常优秀,但与 o1 pro 相比,根本无法达到这种深度的洞察力。「o1-pro is so special! 」以下是 o1 pro 读完文章后给出的反馈建议。当然了,据 Derya 所说,大概只有少数具备丰富免疫学知识的人才能完全理解 o1 pro 批评建议的精彩。
o1 pro 从多个维度对综述文章进行了批判性评估。首先,o1 pro 指出文章涉及的主题范围过广,虽然涵盖了 MAIT 细胞的基本生物学、在传染病中的作用以及在癌症中的双重效应等,但在每个方面的探讨深度不够。接着,o1 pro 指出文章在结构与概念清晰度上也有提升空间。在很多细节方面,o1 pro 指出,这篇综述文章也没有探讨清楚。对于两种 MAIT 细胞治疗策略(CAR-MAIT 细胞治疗和 iPSC 来源的 MAIT 细胞治疗)的探讨,o1 pro 也给到了相应的建议。o1 pro 还讨论了综述文章在方法学方面的不足,具体涉及文献选择方法和人类与动物模型的比较。最后,o1 pro 强调,尽管文章在结论中提到需要更多研究,但缺乏具体的方向性建议。在人文研究方面,o1 pro 也有了大显身手的机会。
Kay Sorin 的这位朋友是著名出版社的记者,但一直以来非常抗拒 AI 为工作提供帮助的建议。目前,他在撰写一本需要复杂历史研究的传记时,遇到了一个困难 —— 无法从资料中,找出名为 Jonathan 这位默默无闻作家的姓氏。而且,这些文件没有任何识别信息,更像是感谢信和便条之类的东西。由此,Kay Sorin 决定尝试为其提供帮助。她上传了 4 张图片给到 GPT-4o,并问道「这位 Jonathan 在 1980 年代是《纽约书评》的作家和知识分子。他的姓是什么」?GPT-4o 思考了 52 秒,给出回答:接下来,她又将同样提示扔给 o1 pro,在思考了 1 分 57 秒后,它找得到了全名「Jonathan Lieberson」。Kay Sorin 朋友对此感到非常惊讶,并再次问 o1 pro,「你是找到更多关于 Jonathan 的消息来源」?o1 pro 给出了几段解释,并提出了连记者本人都没有想到的建议。
o1 pro 在 STEM 领域中的表现,已经屡见不鲜,这也是它在人文领域很好的证明。参考资料:本文来自微信公众号:新智元(ID:AI_era)
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,蓝鸢梦想所有文章均包含本声明。