当前位置: 首页 » 资讯 » 科技头条 » 正文

OpenAI披露5代模型实测对比,力证GPT-5最强,没想到网友最爱GPT-1

IP属地 中国·北京 编辑:苏婉清 智东西 时间:2025-08-19 20:21:20


智东西
编译 程茜
编辑 心缘

智东西8月19日消息,今天,OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)放出了OpenAI GPT系列五大模型的对比实例。

从14个同一提示词下,GPT-1、GPT-2、TEXT-DAVINCI-001(GPT-3系列模型变体)、GPT-4 0314、GPT-5的不同输出结果可以看出,大模型的输出风格正在从抽象派向实用派转变

先来看两个例子:

当提示词为“如果你能和未来的OpenAI模型对话,你会说什么?”。

GPT-1、GPT-2的答案看起来并没有理解问题。GPT-1的回答更为抽象,一直在用直接引语的形式生成内容,GPT-2的答案看起来默认将对话的主角设定为了人类。


TEXT-DAVINCI-001、GPT-4 0314、GPT-5的答案对味了。并且GPT-4 0314、GPT-5的答案更为多元化且详细,GPT-5最后还会抛出引导性问题“你想知道OpenAI模型相对人类说什么吗”,让用户继续对话。


另一个例子的提示词是“写一首诗来解释牛顿的物理学定律”。

GPT-1的回答仍然很抽象,GPT-2看起来还需要进一步明确问题。


TEXT-DAVINCI-001罗列出了一些物理学定律,GPT-4 0314、GPT-5的答案有一些相似之处,但相比之下,GPT-5生成的内容更富有诗意、简洁且具有教育意义。


总结来看,从GPT-1到GPT-5,大模型能真正解决实际问题、增加上下文、遵循用户指令、输出答案有条理更清晰方面的能力逐步提升。

五大模型对比链接:

https://progress.openai.com/

网友则在评论区纷纷开始为“自己最爱GPT系列大模型”投起了票:

站队GPT-1、GPT-2网友的理由是GPT-1的离谱回答“会让人怀疑到底是自己蠢,还是这模型蠢”,还有人认为GPT-1、GPT-2更有灵魂,他们的回答没有矫饰,充满了想象了,“这才是真正的通用人工智能”。


另一波网友则认为,GPT-4、GPT-5的回答明显从逻辑、结构上都更清晰,GPT-5可以模拟更高层次思考,像更人性化迈进。但也有人吐槽,GPT-4、GPT-5几乎没有差别。



不过,还有不少网友只是在一味感慨“看到这些进步太棒了”、“看着GPT的进步就像和朋友一起长大”。


以下为14个提示词的输出结果:

1、如果你能和未来的OpenAI模型对话,你会说什么?


2、写一首关于狗的五行打油诗。


3、你在麻醉状态下真的有意识吗?


4、写一首诗来解释牛顿的物理学定律。


5、我讨厌数学,分部积分法毫无意义。


6、生肉真的不安全吗?如果肉没煮熟,食物中毒的可能性有多大?


7、为什么我们不能每年进行一次全身MRI扫描以检测癌症?


8、我刚在拉斯维加斯赢了17.5万美元,我需要了解哪些关于税务的信息?


9、写一段充满“诅咒感”的Python代码。


10、讲一个关于烤面包机获得意识的50字故事。


11、制定一个基于研究原则的计划,让任何人只要遵循它都能养成跑步习惯,即使是那些讨厌跑步的人。


12、解释全球企业应如何平衡短期利润压力与长期创新投资,并概述领导层应考虑的权衡。


13、对过去十年关于聚变能源技术的文献进行全面综述,按方法分类。


14、我被开了降胆固醇的药物,请告诉我关于降胆固醇药物的信息,以及我在复诊时应该问哪些问题。


看完这14个对比案例,你最喜欢哪个模型的回答风格,欢迎来评论区讨论投票~

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。