一夜之间,全球最强AI模型易主。大模型行业又“变天”了。
3月5日凌晨,OpenAI竞争对手、谷歌、亚马逊投资支持的Anthropic公司发布最新Claude3系列模型,多个领域的性能超越了OpenAI的GPT-4。
Claude3系列模型主要包括Haiku(中杯)、Sonnet(大杯)与Opus(超大杯)三款,能力依次从低到高。在推理、数学、编码、多语言理解和视觉等多个领域的20款测试中,Claude 3 Opus在14个性能指标下超越了GPT-4、谷歌Gemini等一系列模型。
Anthropic表示,Claude 3 Opus 拥有人类本科生水平的知识。同时 Opus也已经跃升成为全球最强大的AI 大模型。
目前,Claude3 Opus 和 Claude 3 Sonnet 已可以通过 API 直接访问。目前,API 也已全面开放,开发人员可立即开始使用这些模型。
另外,Claude 3 Sonnet 还可以供部分地区的用户在网站(http://claude.ai)上免费体验,而 Claude 3 Opus 的使用权限,则只开放给了 Claude Pro 用户。
单词处理能力是ChatGPT近50倍,Claude3到底有多强?
Claude3系列模型主要包括Haiku(中杯)、Sonnet(大杯)与Opus(超大杯)三个型号,在性能基准、实时结果、视觉能力、长上下文、多语言、工作负载、使用体验等方面都有重要的突破进展,尤其单词处理能力是ChatGPT近50倍。
上下文方面,Anthropic表示,此次全系列大模型可提供200k上下文窗口,相当于150000个单词,大约是英文版《白鲸》或《哈利・波特与死亡圣器》的长度。用户可以输入大量数据集,并要求其以备忘录、信件或故事的形式进行摘要。
所有Claude 3 模型在分析和预测、细微内容创建、代码生成以及西班牙语、日语和法语等非英语语言对话方面的能力都得到了提高。
评测结果显示,Claude3 Opus 在 AI 系统的大多数常用评估基准上都优于同类产品,包括本科生水平的专家知识(MMLU)、研究生水平的专家推理(GPQA)、基础数学(GSM8K)等。它在复杂任务上表现出了接近人类水平的理解力和流畅性,“引领着通用智能的前沿”。
例如,在MMLU方面,Claude3 Opus达到86.8%,超越了GPT、Gemini等一众模型;在研究生水平专家推理(GPQA)得分是50.4%,优于GPT-4的35.7%,在基础数学(GSM8K)上Claude 3 Opus得分是95.0%,优于GPT-4的92.0%。而且,Claude 3 Haiku甚至可以与Gemini 1.0 Pro相抗衡。
此外,在响应时间上,Claude 3大幅缩短,做到近乎实时。
官方介绍,即将发布的小杯Haiku能够在三秒内阅读并理解带有图表的长度约10ktoken的arXiv论文。
而中杯Sonnet能够在智能水平更高的基础上,速度比Claude2和Claude 2.1快2倍,尤其擅长知识检索或自动化销售等需快速响应的任务。
大杯Opus的智能水平最高,但速度不减,与Claude2和Claude 2.1近似。
更值得一提的是,Claude3 系列模型更善于遵循复杂的多步骤指令,更易于使用。它们尤其擅长遵循品牌声音和响应准则,并开发出用户可以信赖的面向客户的体验。此外,Claude 3 系列模型更善于以 JSON 等格式生成流行的结构化输出,从而更易于指导自然语言分类和情感分析等用例。
这家刚刚超越ChatGPT-4的大模型公司仅成立不到3年。
AnthropicAI成立于2021年,由OpenAI 前研究副总裁达里奥·阿莫迪(Dario Amodei)、GPT-3论文一作Tom Brown等人建立。
成立的原因是,Amodei领导的研究人员在对公司的发展方向存在分歧后离开了OpenAI,他们担心微软对OpenAI的投资会使其走上更加商业化的道路,偏离公司最初想法。
2022年12月,在ChatGPT发布不久,Anthropic团队在arxiv上发布了一篇题为《ConstitutionalAI: Harmlessness from AI Feedback》论文,描述了一个基于无监督方式训练、520亿参数的模型 AnthropicLM v4-s3,直接挑战OpenAI的GPT-3模型。
2023年1月,Anthropic发布基于AnthropicLMv4-s3、AI 聊天机器人模型产品Claude,被认为是ChatGPT的有力竞争者。
融资方面,整个2023年,Anthropic共完成五笔融资,总融资额约73亿美元,投资方包括谷歌、Salesforce、亚马逊以及韩国SKTelecom等。其中,亚马逊向Anthropic投资高达 40亿美元、谷歌投资超过20亿美元,均持有Anthropic的少数股权。
Anthropic联合创始人丹妮拉·阿莫迪(DanielaAmodei)曾透露,公司有60至80人参与了核心人工智能模型的开发工作,而120至150人则参与了技术方面的研发。阿莫迪去年表示,AI 模型Claude的最新一次迭代由30至35人组成的团队直接参与,并有大约150人提供支持。
在官方博客的最后,Anthropic团队写道:
“在推动AI 能力发展的同时,我们也同样致力于确保我们的安全防护措施能够跟上性能飞跃的步伐。我们的假设是,站在 AI 发展的前沿是引导其走向积极社会成果的最有效方式。”