DeepSeek的头号黑粉乐坏了!


2月25日,Anthropic传出了两条让DeepSeek黑粉非常兴奋的消息。
01
Anthropic的混合模型发布
首先,Anthropic推出了首个“混合模型”Claude 3.7 Sonnet。

在腾讯、阿里、xAI等纷纷效仿DeepSeek,发布各自的推理模型时,Anthropic采取了“一网打尽”的策略。
结合了及时应答与深度思考,摒弃了传统的多模型堆积方法。
其次,几乎与Claude 3.7 Sonnet的发布同时,《华尔街日报》报道称Anthropic即将完成一轮35亿美元的融资,估值可能高达615亿美元,是之前180亿美元估值的三倍多。
Anthropic不仅仅是一家公司,它还是OpenAI的“叛军”、硅谷的明星AI初创企业。
在过去的一个月中,这家公司还身兼“DeepSeek头号黑粉”的角色。
不断质疑V3的600万美元训练成本,甚至由其中一位联合创始人亲自撰写檄文,呼吁美国加强芯片出口控制。
如今,随着新模型的发布和融资的即将完成,Anthropic成功顶住了DeepSeek的压力。
这不仅是Anthropic的好消息,实际上,在华尔街和大众因DeepSeek质疑硅谷的高投入AI战略时,Anthropic的表现还在证明,神话尚未破灭。
对于正在融资的OpenAI等企业来说,这无疑是一个积极的信号。
DeepSeek R1推理模型推动下,OpenAI迅速推出了o3 mini,马斯克的xAI上周也发布了Grok 3并引入了Grok Reasoning。
而Anthropic此时则选择了混合模型。 虽然一直有传言称Claude 4即将发布,但Anthropic实际上推出的是Claude 3.7 Sonnet。
Anthropic表示,Claude 3.7 Sonnet是市场上首个“混合模型”,将立即投入使用。
这种“混合”是业内首个在单一架构上整合实时应答和深度思考的模型。
和DeepSeek的R1模型或OpenAI的o3-mini不同,这些模型都是严格的推理模型。
在使用R1和o3-mini时,思考过程是强制的,用户只能等待,这会延长获得答案的时间。
有些问题实际上并不需要长时间的思考,这时就需要用户来判断并切换到及时应答模型。
但在Claude 3.7 Sonnet这种混合模型中,用户不需要切换就可以获得实时应答或深度思考。
“这个模型整合了所有功能——我们的目标是拥有一个能适用于各种场景的统一AI。会感到更加简单。
”Anthropic的联合创始人兼首席科学家贾雷德·卡普兰(Jared Kaplan)表示。
卡普兰将其比作人类大脑的运行方式:有些问题需要深度思考,有些则需要快速回答。Claude 3.7 Sonnet将这两种能力整合在一个模型中。
除此之外,用户还可以利用“草稿”功能,在问题比较复杂时指导模型进行更精确的思考;
API用户还可以精确控制Claude 3.7 Sonnet的思考时长,甚至控制预算,例如最多思考多少个tokens。
在模型表现上,相比于上一代Claude 3.5 Sonnet,“Claude 3.7 Sonnet在遵循指令、推理、多模态能力和自主编码方面表现出色,尤其是在数学和科学领域,扩展思维能力得到了显著提升。”
02
模型表现与市场反馈
数学和编码能力提高了10%,尤其是编码能力,在多个测试中表现突出。

根据SWE Bench测试数据,Claude 3.7的代码能力大幅超越DeepSeek R1、OpenAI的o1、o3模型。专注于AI编程的公司Cursor已经宣布将集成Claude 3.7 Sonnet。
Claude 3.7 Sonnet已经全面上线,支持免费版、专业版、团队版和企业版,此外还可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。免费用户目前无法使用扩展思考模式。
在定价方面,Claude 3.7 Sonnet的价格为:输入3美元/百万tokens,输出15美元/百万tokens。
这与前代模型保持一致,显著高于竞争对手的纯推理模型,如OpenAI o3 mini(输入1.1美元/百万tokens,输出4.4美元/百万tokens)和DeepSeek R1(输入0.55美元/百万tokens,输出2.19美元/百万tokens)。
同时,Anthropic也发布了专注于代码的Agent Claude Code,可以直接在终端运行,帮助开发者完成编程任务。
从搜索、阅读代码、编辑文件、编写代码、运行测试,一直到将代码提交到GitHub。不过,目前Claude Code仅作为有限的研究预览版提供。
03
Authropic融资
在发布大模型的同时,Anthropic正在进行的融资也传来好消息:《华尔街日报》报道:“Claude背后的公司克服了由于中国DeepSeek的成功引发的投资者担忧,估值达到615亿美元。”
据称,Anthropic即将完成一轮35亿美元的融资,估值将达到615亿美元。

最新一轮融资的投资者包括风投公司Lightspeed Venture Partners、General Catalyst和Bessemer Venture Partners。总部位于阿布扎比的投资公司MGX也在洽谈参与事项。
这个数字虽然与OpenAI的1570亿美元估值还有距离,但已经超过了xAI去年底的400亿美元估值。xAI也正在寻求融资,预计估值750亿美元。
这次融资之前,Anthropic的估值还只有180亿美元。知情人士透露,Anthropic最初计划筹集20亿美元,但在与投资者的谈判期间成功提高了这一数额。
Anthropic一直在追赶,甚至采取了“要超过你们所有人”的态度。可以说,今天的两个好消息都在巩固Anthropic身上的各种标签。
04
Authropic与DeepSeek的竞争
Anthropic自2021年成立以来,因其由OpenAI前员工创办,便获得了“OpenAI叛军”的称号。

之前,Anthropic已经多次抢在OpenAI之前。如去年的“代理”功能,OpenAI在Anthropic之后跟进。
这次发布混合模型,高举“反对多模型堆积方案”的大旗,让人想到了OpenAI CEO山姆·奥特曼(Sam Altman)不久前发布的GPT 5计划。
当时奥特曼表示,意识到模型和产品功能过于复杂,未来将进行统一。没有想到又被Anthropic抢先了一步。
Anthropic的联合创始人卡普兰和迈克·克里格(Mike Krieger)都表示,预计竞争对手很快也会转向这种混合模型的方向。
另一方面,在DeepSeek R1横空出世之后,Anthropic俨然化身为“DeepSeek头号黑粉”。
对DeepSeek的态度,硅谷大佬们大多是赞许中带有苦涩,但表达上还算客气。
如马斯克在Grok 3发布前,一边赞许DeepSeek R1很强,给中国工程师点赞,但也表示DeepSeek带来的不算AI领域的一次突破,并顺势夸赞了自家的模型。
奥特曼一边大赞DeepSeek“是令人印象深刻的模型”,一边暗地里表示DeepSeek用OpenAI专有模型训练自己的模型,可能违反了其服务条款。
后来又“大方”表示“没有起诉DeepSeek的计划”。
