在科技與資本的交匯處,新的風暴正在醞釀。這次,風暴的中心不再是虛擬世界的代碼與算法,而是連接 AI 與物理世界的橋梁——具身智能。順勢,AI 界的領頭羊阿里也來攪局了。
近期,阿里通義千問技術負責人林俊旸發(fā)文稱,其在 Qwen 內部組建了一個關于具身智能的小組。這標志著阿里正式進軍物理 AI。事實上就在一個月前,阿里云領投了國內機器人創(chuàng)業(yè)公司自變量機器人的 1.4 億美元融資。
從投資到親自下場,阿里的野心昭然若揭,它正全力以赴,為 AI 尋找一具能夠感知和改造物理世界的 " 身體 "。這背后是一個深刻的時代背景:我們正處在一個奇特的 AI" 斷層 " 時代。
一方面,AI 的 " 大腦 " ——以通義千問、GPT-4 為代表的大語言模型,正以前所未有的速度進化,展現(xiàn)出驚人的認知與生成能力。但另一方面,AI 的 " 身體 " 卻顯得笨拙。在物理世界中,除了特定場景下的工業(yè)機械臂,幾乎看不到能夠自主理解環(huán)境、與人協(xié)同的智能物理實體。
如此斷層亦蘊含著巨大機遇,去年吳泳銘就直言,AI 最大的想象力是接入現(xiàn)實世界。在今年 6 月的年度股東大會上,黃仁勛強調,AI 和機器人技術是最大的兩個增長機會,代表著數萬億美元級別的增長機會。
眼下,OpenAI、Google、軟銀、英偉達等巨頭們紛紛在具身智能賽道重點布局。一場為 AI" 尋找身體 " 的戰(zhàn)爭已經悄然打響,對于正處在轉型與價值重估關口的阿里而言,這也將是它實現(xiàn) ASI 的宏偉理想、" 再偉大 " 的關鍵一極。
從云端到現(xiàn)實
10 月 8 日,林俊旸發(fā)布了一條分量十足的消息:團隊已正式建立 " 機器人和具身智能小組 "。
林俊旸在推特中指出,多模態(tài)基礎模型正轉變?yōu)榛A Agents,這些 Agents 可以利用工具和記憶,通過強化學習進行長視野推理," 它們絕對應該從虛擬世界走向物理世界 "。
這意味著,阿里要決心讓通義千問從語言世界跨進物理世界。就在不久前的云棲大會上,阿里巴巴集團 CEO 吳泳銘斷言,行業(yè)正進入 AI 的 " 自主行動 " 階段。吳泳銘說,未來或將有超過全球人口的智能體和機器人與我們共同工作生活。
對阿里而言,將 AI 從云端推向實體世界正是其通往超級人工智能(ASI)宏大藍圖中至關重要的一步。事實上,在臺下阿里已經為進軍具身智能而布局已久。
自 2024 年以來,阿里集團陸續(xù)投資了逐際動力、星動紀元、宇樹科技、星海圖、靈心巧手等一批具身智能公司。阿里云則在今年 9 月領投了自變量機器人的 1.4 億美元融資。
有知情人士指出,去年上半年,阿里開始重點關注具身智能," 投了幾乎所有具身智能公司 "。因為機器人是大模型能力從數字世界走入物理世界最理想的載體。阿里通過投資宇樹、逐際動力、自變量機器人等不同技術路線的公司,搶占賽道。
顯然,阿里對具身智能的布局并非一時興起。要理解其動機,必須將其置于阿里當前的內外部環(huán)境以及對未來科技終局的判斷之中。
首先,這是戰(zhàn)略的必然性:AI 的終點必然是物理世界。當大語言模型的能力趨于完善,其價值的進一步釋放必然要求它能夠感知、理解并改造物理世界。一個只能在對話框里運行的 AI,其商業(yè)天花板是可見的,但一個能夠通過機器人實體與環(huán)境互動的 AI,潛力則是無限的。
阿里的動作放在全球 AI 版圖上看,并不孤單。
就在同一周,軟銀集團宣布以 54 億美元收購 ABB 的工業(yè)機器人業(yè)務;英偉達 CEO 黃仁勛也再次提到,AI 與機器人是 " 數萬億美元級別的長期增長機會 "。馬斯克將其人形機器人 " 擎天柱 " 視為特斯拉未來價值的核心,首先要顛覆自家工廠的生產模式。
全球巨頭都在下場,物理 AI 成了下一個戰(zhàn)場。對于阿里而言,其商業(yè)帝國的根基——電商、物流、新零售都與物理世界緊密相聯(lián)。無論是菜鳥網絡遍布全球的智慧倉儲,還是盒馬鮮生的自動化供應鏈,都存在大量需要與物理實體交互的場景。
可以說,這些場景是具身智能最直接、最廣闊的應用試驗場。因此,將 AI 能力 " 實體化 " 是對其核心業(yè)務升級的內生需求。
面對如此激烈的競爭格局,阿里如果缺席,無異于將未來物理世界的入口拱手讓人。這是阿里為資本市場講述增長新敘事、注入 " 強心劑 " 的迫切需要。
近年來,阿里核心電商腹地遭遇拼多多、抖音等新業(yè)態(tài)的沖擊。此時亟需一個充滿想象力的新故事來重新點燃投資者的信心。云計算與 AI 無疑是這個新故事的最佳主角,而具身智能的加入,則為這個故事增添了最硬核的一章。
它將阿里的能力從線上延伸到線下,從虛擬拓展到現(xiàn)實,向資本市場傳遞了一個清晰的信號:阿里正進化為一家能夠定義未來物理世界形態(tài)的、更底層的科技平臺型公司。
有行業(yè)研究人士向華爾街見聞指出,通過直接參與機器人研發(fā),阿里既能驗證大模型在真實物理環(huán)境中的適應性,反向驅動模型在噪聲處理、因果推理等領域的進化;又能拓展數據采集維度,將訓練場景從文本圖像延伸至機械控制、傳感器反饋等工業(yè)級應用。
這種從商業(yè)模式創(chuàng)新到硬核科技創(chuàng)新的轉型,是重塑其市場估值、開啟第二增長曲線的關鍵。
填補行業(yè)鴻溝
" 現(xiàn)在 AI 寫文作畫,已經比 99.99% 的人都要做得好。但真正讓 AI 干活,還是一片荒漠。" 在一個月前的外灘大會,宇樹科技創(chuàng)始人王興興在圓桌論壇發(fā)言時如是說道。
可以說,當下正處在一個技術 " 斷層 " 地帶。一邊是 AI" 大腦 " 大模型的智慧正在以指數級速度爆發(fā),另一邊是 AI" 身體 " 的笨拙與物理世界的復雜性形成了鮮明對比。這道鴻溝限制了 AI 的潛力。
牌桌上的玩家們已經達成共識:讓 AI 擁有身體,進入物理世界 " 干活 ",是一片巨大的藍海。
摩根士丹利預測,到 2050 年,全球人形機器人將累計部署 10 億臺,市場規(guī)模達 5 萬億美元。這一數字大約是 2024 年全球 20 家最大汽車制造商總收入的兩倍。據中金估算,中國人形機器人潛在市場空間有望于 2050 年達 22.8 萬億元,2024-50 年復合年均增長率達 24.7%。
如此確定性,將全球具身智能市場推向了爆發(fā)的前夜。各路玩家和資本都爭先恐后,極力把握這股歷史性的機遇。優(yōu)必選、宇樹科技、銀河通用、智元機器人等企業(yè)都宣布今年預計量產千臺人形機器人。
燥熱的氛圍下,今年機構們的熱錢也爭相涌進具身智能賽道。有行業(yè)投資人士表示,今年以來具身智能領域頻頻出現(xiàn)單筆超 5 億元人民幣級別的融資,包括宇樹、銀河通用、千尋智能、星動紀元、逐級動力、它石智航等。
一個爆發(fā)的新趨勢已經逐漸浮現(xiàn)。不過,掘金的過程并非一蹴而就,如何讓大模型完全融入具身智能,是眼下橫亙在 AI 落地物理世界的關鍵卡點。
而阿里,要做填補這一鴻溝的 " 賣鏟人 "。
此前,王興興曾多次表示,與硬件相比,具身智能更大的挑戰(zhàn)是大模型方面的短板," 最大的問題是具身智能 AI 不夠用。"
過去很多大模型在虛擬場景里表現(xiàn)亮眼,一到物理世界就水土不服。因為傳統(tǒng)大模型依賴海量互聯(lián)網文本數據訓練,而具身智能需物理世界交互數據,數據更少量且獲得難度更高。
不僅如此,阿里云智能集團公共云事業(yè)部具身智能負責人高飛向華爾街見聞指出,未來幾年行業(yè)數據量將穩(wěn)步攀升,對應的清洗、存儲和訓練壓力也會隨之放大。" 僅憑具身智能公司一己之力,這樣的壓力是很難頂住的 "。
好在,阿里做好了準備。
目前,阿里 Qwen3-Max 參數規(guī)模突破萬億,在復雜任務分解上表現(xiàn)突出,能支撐機器人處理 " 拆快遞 - 分類物品 - 擺放收納 " 等多步驟任務;Qwen3-VL 則強化了 3D 空間感知與動態(tài)物體追蹤,可精準識別物體位置、判斷運動軌跡。
" 最近一段時間我跑了大概 30 家具身智能公司,跟他們的 CEO 深度溝通后了解到,他們大部分都在用 Qwen-VL 模型去做后訓練。" 高飛向華爾街見聞說道。
這種選擇的共性背后有著充分的技術理由。Qwen-VL 在空間感知、動態(tài)視覺理解、路徑規(guī)劃等方面的能力,恰好契合了具身智能對 " 大腦 " 的核心需求。
此外,阿里云智能集團公共云事業(yè)部具身智能解決方案負責人王旭文指出,過去幾年,阿里服務頭部大模型公司和汽車新勢力的過程中 " 一步一步踩坑 ",積累了大量的基礎設施和實戰(zhàn)經驗。因為具身智能和智能駕駛在工程架構方面有著高度的相似性,所以這些經驗都能夠復用。
這種從模型底層到應用層的全鏈路支撐能力,讓阿里云在具身智能賽道擁有了一個幾乎不可復制的競爭優(yōu)勢??梢哉f,在量產機器人這條路上,阿里云正在幫整個行業(yè)掃清障礙。當這些能力從軟件模擬場景轉向真實世界,具身智能就將真正進入爆發(fā)時刻。
重估阿里:全棧 AI 閉環(huán)
由此,阿里的野心也漸漸清晰:由通義千問擔當通用的 " 大腦 ",負責任務理解與規(guī)劃;由阿里投資的硬件公司擔當專用的 " 執(zhí)行單元 ",負責動作落地。田豐甚至認為,阿里具備將自身業(yè)務與平頭哥芯片技術融合的潛力。未來有機會構建起機器人領域的 AppStore 應用生態(tài)圈。
在這場關乎未來的全球牌局中,每一位玩家都手握不同的牌。事實上,阿里已經組合培育好一套獨特的底牌——一套覆蓋了從算力、云、模型到應用場景的 " 全棧 AI" 閉環(huán)。這不僅是其參與競爭的資本,更是其重塑價值、重述 " 偉大 " 敘事的核心。
回看市場,我們可以看到兩種截然不同的巨頭成長路徑。以軟銀集團為例,其創(chuàng)始人孫正義是一位卓越的 " 獵手 ",通過外部收購和投資,快速拼湊起一個覆蓋全球的 " 信息革命 " 生態(tài)。
相比之下,阿里巴巴的路徑更像是一種 " 耕種 ",依托自身龐大的業(yè)務生態(tài),從內部培育技術生長的土壤。這種模式的優(yōu)勢在于,技術與場景之間存在著天然的聯(lián)系,在具身智能時代,這種聯(lián)系構建了一個獨一無二的飛輪效應。
這個 " 全棧 AI" 閉環(huán)可以被清晰地解構。它的地基是阿里云作為全球領先的云計算平臺,為 AI 的研發(fā)和運行提供了海量的、彈性的計算資源。它的大腦,是基于強大算力研發(fā)的、并在阿里內部多個場景中得到錘煉的通義千問大模型。它的身體,則是通過組建內部團隊和投資外部公司正在補齊的機器人硬件與控制算法。
而這個閉環(huán)最核心、最難以被復制的優(yōu)勢,是其無與倫比的試驗場——豐富的應用場景。從菜鳥網絡的數百萬平方米的倉庫,到盒馬鮮生的自動化門店,再到淘寶天貓的海量商品處理,阿里擁有世界上最龐大、最復雜的真實物理商業(yè)場景。
這四個層次共同構成了閉環(huán):真實場景產生海量數據;數據輸入阿里云進行計算和模型訓練;訓練優(yōu)化后的 " 通義千問 " 大腦指揮機器人;機器人在真實場景中執(zhí)行任務并產生新的數據,反過來進一步優(yōu)化模型。
這個飛輪一旦轉動起來,其迭代速度和效率將是驚人的。它能讓 AI 模型和機器人算法在真實物理世界的反饋中快速進化,遠遠超過那些只能在實驗室環(huán)境中進行測試的競爭對手。
因此,押注具身智能,是阿里試圖通過 AI 敘事 " 再次偉大 " 的必然選擇。阿里不僅是一家成功的商業(yè)公司,更是一家擁有底層核心技術的硬核科技公司。
有行業(yè)投資人指出,只有全棧,才能把 AI 做成真正的基礎設施,讓 AI 應用更低門檻地普及到各個行業(yè)。在全棧 AI 的巨大想象空間下,阿里的估值邏輯隨之再加碼。
近期,高盛將阿里 2026-28 財年資本支出預測大幅上調至 4600 億元。高盛認為,AI 資本支出轉化正重塑阿里增長預期," 阿里 AI 云計算能力的突破性進展和國際化擴張潛力為股價提供了新的上漲動力 "。
歷史的車輪滾滾向前,每一次計算平臺的變革,都會誕生新的王者。如今,我們正站在一個由 AI 和機器人共同定義的新時代的門檻上。阿里這家曾定義了中國一個商業(yè)時代的巨頭,正試圖通過構建一個從云端到地面的全棧 AI 閉環(huán),抓住這次變革的韁繩。
這無疑是一場充滿風險的豪賭,但對于一個渴望 " 再次偉大 " 的巨人而言,這或許是唯一正確的道路。世界正在重估阿里巴巴,而答案,或許就藏在那些即將被賦予智能的 " 身體 " 之中。