“OpenAI叛军”突起，GPT-4一夜之间被拉下神坛！

Original i黑马 i黑马 2024-05-29

昨天，Anthropic发布最新Claude 3系列模型，让全球用户再次沸腾！

据了解，Claude 3在多模态和语言能力指标上，已全面碾压GPT-4。

甚至在推理、数学、编码、多语言理解和视觉方面，都树立了新的行业基准。

网友直呼，大模型又变天了！

Anthropic是谁？

据说，Anthropic就是原OpenAI员工组建的公司，因为一些发展理念不合才直接“反叛”，并成为了OpenAI的最强劲敌。

本次Anthropic共发布三个模型，性能依次从低到高分别是：Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus，并发布了一份长达42页的技术报告。

其中，Claude 3 Opus在本系列中性能最强大。该模型已在多项AI系统常用评估标准中领先业界LLM，如本科级别专业知识（MMLU）、研究生级别专家推理（GPQA）、基础数学（GSM8K）等。

值得一提的是，Claude 3 Opus在处理复杂任务时，其理解和表达能力几乎接近于人类。这意味，人类朝AGI又近了一步。

如果讲得更具体一些，Claude 3系列模型的超强性能主要体现在五个方面：

一是3秒即可读完10k token论文。

Haiku可在3秒内，阅读一个包含图表和图形的信息和数据密集型的研究论文（大约10k token）。

二是超强多模态视觉能力。

该系列模型可处理各类视觉格式，如照片、图表、图形和技术绘图等，甚至在部分视觉能力上，性能刷新SOTA。

三是完善因理解不到位，而拒绝回答的问题。

尤其是可能触及系统安全边界的提问时，大幅度减少了拒绝回应的情况。

四是跟此前版本相比，Claude 3模型准确度大幅提升。

且，未来可能还会增加“引用功能”，即直接指向参考材料中的具体句子，从而验证答案。

五是支持200K超长上下文。

Claude 3系列模型，都将支持至少20万token的上下文窗口和超100万token的输入。且，官方或将向特定用户开放处理更大上下文窗口的功能。

报告数据显示，Claude 3 Opus在200Ktoken的“大海捞针”（NIAH）测试中，准确率高达99%+。

目前，Claude 3 Sonnet、Claude 3 Opus，可在claude.ai及其覆盖159个国家的Claude API上使用。目前开通Claude Pro的用户，则可直接使用性能最强大的Claude 3 Opus。

体验地址：https://claude.ai/chats

获取Anthropic发布的42页技术报告，可在公众号后台回复「0305」

近期原创关注阅读

中国首富钟睒睒的“无妄之灾”

网易营收破千亿，丁磊：今天AI能做到的比过去十年还要重大

听完周鸿祎AI课，我整理出21条笔记

三只羊法务离职称：很喜欢董宇辉，未来有可能带货

周鸿祎：Sora意味着AGI实现将从 10 年缩短到 1 年！

腾讯：解聘120余人，永不录用！

东方甄选首次将“留住直播人才”写入财报！

振聋发聩！一个千亿集团董事长的年底总结

餐饮迎来“万店时代”，1到10000的商业密码是什么

马斯克做到了！“脑电波”控制电脑即将成为现实

“无应用不AI”，创业黑马将举办“2024中国AI产业应用峰会”，国内外院士、首席科学家、产业界和企业界的创新者将莅临大会。峰会现场，创业黑马将正式发布《2024中国十大AI产业应用》榜单。

扫描下方二维码，立即报名参选

↓↓↓

联系我们
转载开白或商务合作：15222191516 与本文作者沟通交流：xyr608与主编交流沟通：chenfu3721i黑马，创业黑马旗下媒体，让创业者不再孤独创业黑马媒体矩阵推荐关注↓↓↓

继续滑动看下一个

i黑马

向上滑动看下一个

李光耀：过早翘起尾巴与美国对抗是中国厄运的开始！

谁会想到，裁员会裁到总编辑头上

太讽刺：搞宣传的，倒台了！

@所有人，今日起全部免费领取

现在有什么副业可以让人快速上岸? 可以试试这个行业，上岸其实不难!!

“OpenAI叛军”突起，GPT-4一夜之间被拉下神坛！

您可能也对以下帖子感兴趣

李光耀：过早翘起尾巴与美国对抗 是中国厄运的开始！

谁会想到，裁员会裁到总编辑头上

太讽刺：搞宣传的，倒台了！

@所有人，今日起全部免费领取

现在有什么副业可以让人快速上岸? 可以试试这个行业，上岸其实不难!!

生成图片，分享到微信朋友圈

“OpenAI叛军”突起，GPT-4一夜之间被拉下神坛！

您可能也对以下帖子感兴趣

李光耀：过早翘起尾巴与美国对抗是中国厄运的开始！