ChatGPT Plus时刻
BayFamily的西太平洋房地产过剩分布图一文中引用了这篇论文结论中的统计图。我想在图片中找找看有没有自己老家的城市,使用了多个免费版本的大预言模型后,只有ChatGPT给出了正确的答案。
以下是各个模型的回答结果
- ChatGPT的回答
为了避免ChatGPT编造错误答案,误导我。所以在第一次提问时,首先问了一个我明确知道存在的城市,长沙。不出意外,ChatGPT给出了正确的答案。 不过平时由于主要使用ChatGPT,达到了免费限额,需要等待一段时间才能问第二个问题。就在这个空档,想着这应该不算是一个很难的任务,既然ChatGPT免费版本可以回答,那么其他模型也应该没大问题,没想到,一个能打的都没有…
- Gemini
等待ChatGPT免费额度恢复期间,第一个尝试Gemini,没想到第一次回答就翻车。正好昨天Google One放水,有Gemini Advanced使用权,就用Gemini 2.5Pro又问了一遍,第二次回答还是让人失望。
- DeepSeek
可能国外的模型不如国内的模型了解中国城市的名称(训练数据差异?),就换用DeepSeek问了相同的问题,由于DeepSeek还不具备共享聊天的功能,用截图的方式共享一下回答:
好像不太对,于是又用深度思考的方式试了一次:
和DeepSeek发生对话的图片,是从和Gemini对话中复制进去的,开始怀疑是图片质量问题,于是从论文中复制了原始图片进去,又问了一次:
让我彻底死心了,那试试Grok吧
- Grok
鉴于之前使用Grok的良好体验,建立了一点信任度,于是在Grok回答三个城市都存在时,我选择了相信,并真的试图找到「银川」在图片中的位置…
被Grok骗到了。不过ChatGPT的免费使用又恢复了,稳健的完成了要回答的问题,也就没有去测试其他模型了。
在ChatGPT回答后,我也进行了一次仔细逐行对比(人工),确认回答正确后,ChatGPT Plus Moment产生了,我想要试试Plus版本。
在Andrej Karpathy如何使用大语言模型这篇文章里,Andrej选择的是$200/月的Pro版本,当时对他介绍Custome GPT功能(Plus版本也提供)就觉得很有用。因为可以复用Prompt,不必每次输入大量文字提供Context。
同样在那个视频中,提到的LLM 排行榜,排在第一的大多还是ChatGPT的模型:
虽然DeepSeek出现给了很多人惊喜,不过事实是,还是有人认为Plus提供的能力值得。
那就让我们开始吧!
其他资源
YouTube上这个视频的介绍了ChatGPT Free,Plus之间的不同功能(以及其他更高级版本),可以参考。
回到顶部