123,123,123

近日，有報道稱人工智能領(lǐng)域新星Anthropic正在進(jìn)行一筆高達(dá)20億美元的融資談判，該輪融資由Lightspeed Venture Partners（光速創(chuàng)投）領(lǐng)投。

自2021年成立以來，Anthropic已從Menlo Park Ventures等VC以及亞馬遜、谷歌和 Salesforce等科技巨頭獲得超過113億美元的資金。最新一輪融資完成后，Anthropic估值將達(dá)到600億美元，較一年前的180億美元估值翻了三倍多。600億美元的估值意味著Anthropic將躋身美國估值最高的五大創(chuàng)業(yè)公司，僅次于SpaceX、OpenAI、Stripe和Databricks。

最近，海內(nèi)外模型廠商相繼開啟了新一輪融資。上個月，馬斯克的大模型平臺xAI完成了60億美元的C輪融資，市場估值超過400億美元。國內(nèi)模型廠商方面，2024年12月11日，面壁智能宣布完成新一輪數(shù)億元融資；12月17日，智譜AI獲得新一輪30億元融資；12月23日，階躍星辰完成了數(shù)億美元的B輪融資。

火熱背后，傳出異動。李開復(fù)創(chuàng)立的零一萬物被曝要將團(tuán)隊整體打包賣給阿里，雖然李開復(fù)連夜在朋友圈辟謠否認(rèn)出售，但零一萬物明顯減少了對基礎(chǔ)大模型的押注。多位投資人、業(yè)內(nèi)高管向時代周報記者透露，“AI六小龍”普遍已不在預(yù)訓(xùn)練方面傾斜更多精力。

Anthropic的市場期待已高于OpenAI？

Anthropic由一對在美國舊金山的意大利裔美籍兄妹創(chuàng)立，兩人都是OpenAI的早期員工。公司成立兩個月后，A輪融資就籌集了1.24億美元；一年后拿下5.8億美元的B輪融資，團(tuán)隊隨之?dāng)U展到40多人。

Anthropic的大語言模型Claude，被認(rèn)為是OpenAI ChatGPT的最大競爭對手。Claude主要被應(yīng)用在B端銷售、營銷和客戶服務(wù)等領(lǐng)域。據(jù)了解，Anthropic目前的年化收入約為8.75億美元，主要來自B端客戶，按照600億美元估值計算，Anthropic估值/收入比約68.6倍；OpenAI的最新估值為1570億美元，預(yù)計2024年收入為37億美元，估值/收入比約為42.4倍，這意味著市場對Anthropic寄予了高度期待。

與背靠微軟的OpenAI相比，Anthropic背后的支持者并不遜色，這些公司都希望全力爭奪未來十年內(nèi)市場收入超過1萬億美元的AI份額。

作為Anthropic的重要支持者，亞馬遜在去年11月追加了40億美元投資，成為Anthropic的最大投資者。同時，Anthropic也承諾使用亞馬遜云科技的自研芯片Trainium和 Inferentia來訓(xùn)練和部署其人工智能模型；谷歌此前也表示向Anthropic投資20億美元，并已確認(rèn)持有該公司10%的股份，同時兩家公司之間簽訂了一份大型云計算合同。

Anthropic在去年加大了研發(fā)力度，技術(shù)和產(chǎn)品迭代加速。去年9月，Anthropic推出了Claude Enterprise，這是自其聊天機(jī)器人Claude問世以來最大的產(chǎn)品更新，專為希望將人工智能技術(shù)集成到業(yè)務(wù)中的企業(yè)設(shè)計。早些時候，Anthropic還推出了更強(qiáng)大的AI模型Claude 3.5 Sonnet。

2024年10月，Anthropic宣布其AI智能體能夠像人類一樣使用計算機(jī)完成復(fù)雜任務(wù)。據(jù)介紹，Anthropic的“計算機(jī)使用能力”新功能使其能夠與計算機(jī)界面交互，解讀計算機(jī)屏幕上的信息、選擇按鈕、輸入文本、導(dǎo)航網(wǎng)站并通過任何軟件和實時互聯(lián)網(wǎng)瀏覽執(zhí)行任務(wù)，這為實現(xiàn)更智能化的工作流程奠定了基礎(chǔ)。

國內(nèi)獨角獸“讓路”大廠

Anthropic和OpenAI的大參數(shù)模型對外發(fā)布速度已經(jīng)放緩。

Anthropic Claude系列模型從大到小，分為Opus、Sonnet和Haiku 3個版本。Claude 3發(fā)布了全部 3個版本，而 Claude 3.5 目前只對外發(fā)布了Sonnet和Haiku。同樣地，GPT-5（或GPT-4.5）也遲遲未出現(xiàn)在大眾眼前。

據(jù)了解，Opus模型和GPT-5均在內(nèi)部取得了良好的測試效果，但因效果無法與成本匹配都被內(nèi)部當(dāng)作“教師模型”使用，即在內(nèi)部扮演者提升小模型性能的角色。

對大參數(shù)模型，國外創(chuàng)企尚在堅持，國內(nèi)獨角獸已“讓路”大廠。

1月6日晚，有消息稱零一萬物將把預(yù)訓(xùn)練團(tuán)隊和算力資源打包出售給阿里云。隨后，第一財經(jīng)也報道，“阿里云正在洽談收購零一萬物的預(yù)訓(xùn)練團(tuán)隊，已談好報價�！北藭r，阿里云未對該消息作出回應(yīng)。

零一萬物CEO李開復(fù)很快在朋友圈辟謠稱，“不知為什么會有這樣的謠言散播，不過散的快，撤的也快。”零一萬物公眾號在凌晨發(fā)布官方回應(yīng)，否認(rèn)“阿里收購零一萬物”。后據(jù)界面新聞和智能涌現(xiàn)報道，相比于“零一萬物出售預(yù)訓(xùn)練團(tuán)隊”的說法，更接近事實的是，零一萬物的確在進(jìn)行預(yù)訓(xùn)練團(tuán)隊及Infra團(tuán)隊的調(diào)整，部分人員以跳槽形式加入阿里旗下公司。其中預(yù)訓(xùn)練算法團(tuán)隊獲得通義團(tuán)隊offer，Infra團(tuán)隊則獲得阿⾥云offer。

1月7日，李開復(fù)回應(yīng)表示，只有大廠能夠“燒”超大模型，零一萬物內(nèi)部愿意繼續(xù)訓(xùn)練超大參數(shù)模型的成員，加入了零一萬物和阿里云成立的“產(chǎn)業(yè)大模型聯(lián)合實驗室”。

去年5月，在零一萬物發(fā)布千億參數(shù)模型Yi-Large時，李開復(fù)還宣布公司已經(jīng)啟動下一代萬億參數(shù)Yi-XLarge MoE模型訓(xùn)練。當(dāng)時，智譜、MiniMax、百川、月之暗面、零一萬物、階躍星辰在內(nèi)的“AI六小龍”也在全力追逐AGI。

困擾李開復(fù)的“預(yù)訓(xùn)練”是什么？所謂“預(yù)訓(xùn)練（pre-train）”，指對大模型的基礎(chǔ)教育，即賦予模型海量而通用的知識，來決定模型性能，這是模型廠商最核心的技術(shù)壁壘。而狂堆參數(shù)的Scaling Law，目前是預(yù)訓(xùn)練的主流路徑，同時也意味著高昂且持續(xù)的算力和數(shù)據(jù)投入。

馬斯克曾估算，GPT-5的訓(xùn)練可能需要3萬-5萬張H100，僅芯片成本就超過7億美元（約50億元），對于尚未規(guī)�；膭�(chuàng)業(yè)公司而言，繼續(xù)堆參數(shù)訓(xùn)練模型，要跨越高企的資金門檻。

而大模型發(fā)展至當(dāng)下階段，邊際效應(yīng)顯現(xiàn)。在接受晚點采訪時，李開復(fù)提到，去年9、10月時，公司看到Scaling Law明顯進(jìn)入 diminishing return（收益遞減）。不是說用更多算力和數(shù)據(jù)做不出進(jìn)步，而是進(jìn)步不符合投資回報，“從一張卡加到10張卡時，可以達(dá)到9.5張卡的價值，但從10萬張卡加到100萬張卡，也許只能達(dá)到 30萬張卡的價值”。

事實上，去年10月有報道稱，“AI六小龍”中已經(jīng)有兩家公司逐步放棄預(yù)訓(xùn)練模型，縮減了預(yù)訓(xùn)練算法團(tuán)隊人數(shù)，業(yè)務(wù)重心轉(zhuǎn)向AI應(yīng)用。而目前，放棄預(yù)訓(xùn)練的公司數(shù)量還在攀升。

“當(dāng)下的技術(shù)路徑很容易同質(zhì)化和到達(dá)瓶頸，再多投入也可能無法建立有效壁壘�！币晃粯I(yè)內(nèi)高管告訴時代周報記者，“去年大部分人不是這樣預(yù)期的。彼時大家認(rèn)為，領(lǐng)先的大模型會步步領(lǐng)先，AGI會很快到來。如果該預(yù)期能實現(xiàn)，那的確應(yīng)該在訓(xùn)練上死砸（資金）。至于資金實力強(qiáng)如Open AI和Anthropic的這類企業(yè)想實現(xiàn)‘暴力美學(xué)’，更多要看下一代技術(shù)框架能在什么時間誕生”。

從一級市場資金流向來看，側(cè)重落地的細(xì)分領(lǐng)域AIGC投融資情況相對樂觀。IT桔子的數(shù)據(jù)顯示，2024年國內(nèi)人工智能行業(yè)投資事件466個，投資金額634億元，相比2023年分別減少27%、9%；細(xì)分領(lǐng)域AIGC方面，國內(nèi)AIGC投資事件117個，同比減少26個，投資金額370億元，增加164.82億元，平均每個投資事件投資金額增加了一倍。

“從資金消耗程度來看，訓(xùn)練模型比開發(fā)推廣應(yīng)用要大�！鄙鲜龈吖芟驎r代周報記者解釋稱，投流獲客和推理算力是應(yīng)用層兩大成本，不過，這兩項成本支出的高與低，企業(yè)在策略推進(jìn)上有較大的自主權(quán)和靈活性。

OpenAI勁敵擬融資20億美元背后：大模型融資競賽提速 “AI六小龍”齊讓路大廠？