本報(bào)訊 (記者袁傳璽)1月27日,專(zhuān)注于推理GPU的曦望(Sunrise)在杭州舉辦首屆Sunrise GPU Summit,發(fā)布新一代推理GPU芯片“啟望S3”,并披露其圍繞推理場(chǎng)景構(gòu)建的算力產(chǎn)品體系及共建推理云生態(tài)計(jì)劃。這也是曦望在近一年累計(jì)完成約30億元戰(zhàn)略融資后的首次集中公開(kāi)亮相。

與強(qiáng)調(diào)峰值算力和通用能力的訓(xùn)推一體GPU路線(xiàn)不同,曦望在啟望S3芯片上繼續(xù)強(qiáng)化其“All-in推理”的定位。
曦望聯(lián)席CEO王勇表示,AI行業(yè)正在進(jìn)入以應(yīng)用落地為核心的下半場(chǎng),推理逐步超越訓(xùn)練,成為主要算力消耗場(chǎng)景。相比訓(xùn)練階段的一次性高投入,推理更強(qiáng)調(diào)長(zhǎng)期交付能力、單位成本和系統(tǒng)穩(wěn)定性,這也正在改變GPU的競(jìng)爭(zhēng)邏輯。
據(jù)介紹,啟望S3是一款面向大模型推理深度定制的GPU芯片,圍繞真實(shí)推理負(fù)載,對(duì)芯片架構(gòu)、存儲(chǔ)體系與互聯(lián)方式進(jìn)行了系統(tǒng)級(jí)設(shè)計(jì)。相比上一代產(chǎn)品,啟望S3在典型推理場(chǎng)景下的整體性?xún)r(jià)比提升超過(guò)10倍。
在算力與存儲(chǔ)設(shè)計(jì)上,啟望S3支持從FP16到FP4的精度自由切換,在保證模型效果的前提下顯著提升低精度推理效率;同時(shí)率先在國(guó)內(nèi)GPU產(chǎn)品中采用LPDDR6顯存方案,顯存容量較上一代提升4倍,緩解了大模型推理中常見(jiàn)的顯存瓶頸問(wèn)題。
在DeepSeekV3/R1滿(mǎn)血版等主流大模型推理場(chǎng)景中,啟望S3的單位Token推理成本較上一代降低約90%。王勇表示,這是使“百萬(wàn)Token一分錢(qián)”從概念走向可規(guī)?;渴鸬墓こ棠芰?。
王勇表示,曦望的推理GPU并非單點(diǎn)硬件創(chuàng)新,而是通過(guò)芯片架構(gòu)、軟件體系與算力交付方式的一體化設(shè)計(jì),將硬件能力穩(wěn)定轉(zhuǎn)化為可交付、可計(jì)價(jià)的推理算力。目前,曦望已構(gòu)建與CUDA兼容的基礎(chǔ)軟件體系,支持推理應(yīng)用低成本遷移與持續(xù)優(yōu)化,相關(guān)能力已覆蓋ModelScope平臺(tái)90%以上主流大模型形態(tài)。
圍繞啟望S3,曦望同步發(fā)布了面向大模型推理的寰望SC3-256超節(jié)點(diǎn)方案,可高效支撐PD分離架構(gòu)與大規(guī)模專(zhuān)家并行(EP)部署,適配千億、萬(wàn)億級(jí)參數(shù)的多模態(tài)MoE推理場(chǎng)景。
同時(shí),曦望還推出覆蓋PCIe、OAM模組、一體機(jī)及AI計(jì)算集群在內(nèi)的S3產(chǎn)品矩陣,覆蓋從單機(jī)推理到大規(guī)模集群部署的多樣化需求。
值得關(guān)注的是,曦望通過(guò)生態(tài)共建推理云被視為其推理算力體系中的關(guān)鍵一環(huán)。依托自研推理GPU,曦望實(shí)現(xiàn)從底層芯片到上層平臺(tái)的全棧優(yōu)化,將硬件能力以平臺(tái)化方式穩(wěn)定釋放,從而降低模型適配和系統(tǒng)部署復(fù)雜度,形成面向應(yīng)用落地的完整算力交付路徑。
曦望聯(lián)席CEO王湛表示,新一代的AI算力平臺(tái),應(yīng)具備軟硬件深度協(xié)同、資源利用高度彈性、技術(shù)門(mén)檻低且運(yùn)行穩(wěn)定可靠等特征?;谶@一判斷,曦望通過(guò)云化方式對(duì)算力交付模式進(jìn)行重構(gòu),使推理算力從“設(shè)備能力”轉(zhuǎn)化為可標(biāo)準(zhǔn)化、可規(guī)?;姆?wù)能力。
據(jù)介紹,共建推理云以啟望S3為底座,通過(guò)GPU池化與彈性調(diào)度,將分散的算力資源整合為統(tǒng)一的推理算力池,并以MaaS(Model as a Service)作為核心入口,向企業(yè)提供開(kāi)箱即用的大模型推理服務(wù)。企業(yè)無(wú)需關(guān)注底層硬件配置和集群運(yùn)維,即可按需調(diào)用模型能力,并根據(jù)業(yè)務(wù)負(fù)載靈活擴(kuò)展算力規(guī)模。
曦望董事長(zhǎng)徐冰表示,隨著大模型進(jìn)入規(guī)模化應(yīng)用階段,AI產(chǎn)業(yè)正從“訓(xùn)練驅(qū)動(dòng)”轉(zhuǎn)向“推理驅(qū)動(dòng)”。相比一次性投入巨大的訓(xùn)練,推理更強(qiáng)調(diào)長(zhǎng)期交付能力、單位成本和系統(tǒng)穩(wěn)定性。
他指出,曦望并不希望只做一家賣(mài)芯片的公司,而是希望圍繞推理場(chǎng)景,構(gòu)建“芯片+系統(tǒng)+生態(tài)”的整體布局,讓推理算力真正成為可規(guī)模化、可持續(xù)的基礎(chǔ)設(shè)施。2025年,曦望芯片交付量已突破萬(wàn)片。
“誰(shuí)能持續(xù)降低推理成本,誰(shuí)就掌握了AI產(chǎn)業(yè)的成本曲線(xiàn)。”徐冰表示,曦望希望通過(guò)推理算力體系的系統(tǒng)性創(chuàng)新,助力AI應(yīng)用實(shí)現(xiàn)規(guī)?;涞嘏c可持續(xù)增長(zhǎng)。
(編輯 李家琪)
新一輪以舊換新落地 激發(fā)消費(fèi)新動(dòng)能
首先,一些地方在出臺(tái)與消費(fèi)品以舊換新相關(guān)的……[詳情]
| 09:20 | 康芝藥業(yè):關(guān)于全資子公司參加國(guó)家... |
| 09:20 | 晶澳科技:截至2026年2月28日,公... |
| 09:20 | 東華能源:聘任汪家寶為副總經(jīng)理 |
| 09:20 | 泰山石油:累計(jì)回購(gòu)1081400股 |
| 09:20 | 仕佳光子:公司深耕光通信領(lǐng)域,圍... |
| 09:20 | 山西焦煤:截至2026年2月27日公司... |
| 09:20 | 富維股份:一汽旗翼公司聚焦于紅旗... |
| 09:20 | 心脈醫(yī)療:海外銷(xiāo)售收入超過(guò)2.5億... |
| 09:19 | 翱捷科技:公司可以為ASIC客戶(hù)提供... |
| 09:19 | 三環(huán)集團(tuán):累計(jì)回購(gòu)5133800股 |
| 09:19 | 麗人麗妝:公司將持續(xù)努力保持與現(xiàn)... |
| 09:19 | 麗尚國(guó)潮:控股股東元明控股增持67... |
版權(quán)所有《證券日?qǐng)?bào)》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營(yíng)許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號(hào)京ICP備19002521號(hào)
證券日?qǐng)?bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請(qǐng)仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。
證券日?qǐng)?bào)社電話(huà):010-83251700網(wǎng)站電話(huà):010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注