Claude 3 发布评测:ChatGPT Plus 全面对比,谁更胜一筹?

Claude 3 于今天凌晨正式发布。这款由 OpenAI 分裂而出的兄弟公司 Anthropic 开发的模型,悄然无声地推出了新版本。与其他科技公司不同,Claude 3 并没有召开盛大的发布会,而是通过 X 平台发布了一条简短的消息。

Claude3发布
看起来 Anthropic 对本次 Claude 3 相当有信心。

新模型介绍

Anthropic 今晚共发布了三个模型,分别是:Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。

  • Opus:意为史诗级乐章,功能强大。
  • Sonnet:即十四行诗,适中。
  • Haiku:指日本的三行短诗,功能较为基础。

这三个模型的区别可以通过下图直观了解。

Claude3性能测试

Claude 的免费版本仅支持使用 Sonnet,若要使用 Opus,则需支付 20 美元的订阅费用,这与 OpenAI 的策略相似。ChatGPT 3.5 可免费使用,而 ChatGPT Plus 则需要付费订阅。

训练时间对比

Claude训练时间

Claude 3 的最新训练时间为 2023 年 8 月,而 ChatGPT Plus 的数据更新至 2023 年 4 月。在这一点上,Claude 略胜一筹。

推理能力

根据官方文档,Claude 3 在推理和逻辑方面有了显著提升。以下是一个实际的例子:

题目:解释补集法的概念,并用补集法计算这道概率题:一家公司有两个部门,A部门3个男生,2个女生,B部门4个男生,6个女生,现在要派3个人去出差,要求每个部门至少出一人,那么至少有一个女生被派出的概率是多少?

在明确补集法的情况下,GPT-4 的错误率高达 50%,而 Claude 3 Opus 的准确率达到了 90%。

Claude3推理测试

此外,Claude 3 还能够处理物理题,表现出色。

Claude3识图回答物理问题

对于家长来说,这无疑是辅导孩子学习的好帮手。

多模态能力

Claude 3 也支持绘图功能,准备与 OpenAI 展开全面竞争。

Claude3性能评测

在科学示意图领域,Claude 3 的表现令人惊艳。

Claude3的多模态能力

设计师可以利用 Claude 3 直接生成页面代码,极大提高工作效率。

Claude3根据图片写代码的能力

长文本处理能力

Claude 3 支持处理最长的文本,准确性和上下文理解能力大幅提升。

Claude3的长文本能力

在处理跨长文本的查询时,Claude 3 的表现也相当出色。

Claude3的跨长文本能力的回答

Claude 模型对比

Claude 3 Opus

Claude 3 Opus能力测试

Claude 3 Sonnet

Claude 3 Sonnet能力测试

Claude 3 Haiku

Claude 3 Haiku能力测试

三者之间的功能差异一目了然,付费用户可以获得更强大的功能。

总结

Claude 3 的更新带来了独特的推理能力、与 GPT-4V 相当的多模态功能,以及对长文本的优化。通过 野卡 | 一分钟注册,轻松订阅海外线上服务,我成功订阅了 Claude 3 Pro,整体体验令人惊艳。

尽管如此,OpenAI 依然是全球技术实力最强的人工智能公司,未来推出的 Sora 和 GPT-5 预计将超越现有所有 AI 工具。

对于我个人而言,除了模型本身的能力,模型可用的工具也至关重要。无论是网页浏览能力、代码解释器还是 API 接入,整个生态系统的完善使得 ChatGPT 更加顺手。

通过 野卡 | 一分钟注册,轻松订阅海外线上服务,大家可以自行体验两者之间的差距。

(0)
上一篇 2025年6月23日
下一篇 2025年6月23日

相关推荐