云天勵(lì)飛千卡AI推理集群落地

2026-03-12 12:03 來源：證券日報(bào)網(wǎng)

本報(bào)訊（記者王鏡茹）3月12日，深圳云天勵(lì)飛技術(shù)股份有限公司（以下簡稱“云天勵(lì)飛”）中標(biāo)廣東省湛江市AI滲透支撐新質(zhì)生產(chǎn)力基礎(chǔ)設(shè)施建設(shè)項(xiàng)目，中標(biāo)金額4.2億元。項(xiàng)目將基于云天勵(lì)飛自研的國產(chǎn)AI推理加速卡，建設(shè)國產(chǎn)AI推理千卡集群。

該集群將搭載DeepSeek等國產(chǎn)大模型，為政務(wù)、產(chǎn)業(yè)及各類應(yīng)用場景提供更加便捷、低成本的AI能力，探索打造“國模國芯”的AI生態(tài)樣板。

智算集群是人工智能時(shí)代的基礎(chǔ)設(shè)施。如果說電力支撐了工業(yè)時(shí)代，互聯(lián)網(wǎng)支撐了信息時(shí)代，那么智算正在成為支撐AI時(shí)代的重要底座。

在AI算力體系中，算力大體可以分為訓(xùn)練算力與推理算力。訓(xùn)練算力決定模型如何完成“從0到1”的能力構(gòu)建，而推理算力則直接支撐AI應(yīng)用落地。根據(jù)Gartner預(yù)測，到2026年，約55%的AI專用云基礎(chǔ)設(shè)施支出將用于推理工作負(fù)載。

過去，國內(nèi)許多智算中心普遍采用“訓(xùn)推一體”的建設(shè)模式。而此次在湛江建設(shè)的集群，則定位為專注推理任務(wù)的AI推理集群，主要面向各類行業(yè)應(yīng)用場景，為傳統(tǒng)產(chǎn)業(yè)的AI化提供直接支撐。

近年來，湛江在“DeepSeek+”應(yīng)用探索方面動(dòng)作頻頻。2025年年初，DeepSeek-R1發(fā)布后，湛江市即完成本地部署，基于國產(chǎn)技術(shù)棧的DeepSeek-R1大模型率先在湛江政務(wù)云上線。該模型在處理通用政務(wù)事務(wù)的同時(shí)，還能夠持續(xù)學(xué)習(xí)本地產(chǎn)業(yè)知識與方言表達(dá)。

此次云天勵(lì)飛建設(shè)的AI推理集群，也將與DeepSeek等國產(chǎn)模型進(jìn)行深度適配，為更多行業(yè)應(yīng)用提供算力支撐。

在大模型應(yīng)用場景中，推理系統(tǒng)通常需要同時(shí)滿足高并發(fā)、高吞吐與低延遲三項(xiàng)要求。為提升整體效率，當(dāng)前業(yè)界普遍采用“Prefill–Decode分離”的推理架構(gòu)，通過對不同階段進(jìn)行資源優(yōu)化，實(shí)現(xiàn)系統(tǒng)性能的整體提升。

其中，Prefill階段主要負(fù)責(zé)對長上下文進(jìn)行理解和計(jì)算，計(jì)算量大、帶寬需求高；而Decode階段則負(fù)責(zé)持續(xù)生成Token，對系統(tǒng)延遲更加敏感。如何在兩個(gè)階段之間進(jìn)行合理的資源配置，成為推理系統(tǒng)架構(gòu)設(shè)計(jì)的重要問題。

與此同時(shí)，隨著大模型上下文長度不斷增加，大量中間狀態(tài)需要以KVCache的形式存儲。業(yè)內(nèi)普遍認(rèn)為，未來推理系統(tǒng)的性能瓶頸將越來越多來自數(shù)據(jù)訪問效率，而不僅僅是計(jì)算能力。

在這一背景下，算力、存儲與網(wǎng)絡(luò)之間的協(xié)同設(shè)計(jì)，正逐漸成為AI基礎(chǔ)設(shè)施的重要競爭力。此次在湛江落地的千卡推理集群，正是圍繞這一思路進(jìn)行構(gòu)建。該集群采用云天勵(lì)飛自主研發(fā)的AI推理芯片，并在系統(tǒng)架構(gòu)上確立了“優(yōu)先優(yōu)化Prefill、兼顧Decode”的技術(shù)路線。通過在芯片設(shè)計(jì)中對計(jì)算資源與存儲帶寬進(jìn)行針對性配置，使系統(tǒng)在長上下文推理場景下依然能夠保持較高的吞吐效率。

在網(wǎng)絡(luò)互聯(lián)方面，系統(tǒng)采用統(tǒng)一高速互聯(lián)架構(gòu)，通過400G光網(wǎng)絡(luò)構(gòu)建集群物理層網(wǎng)絡(luò)，實(shí)現(xiàn)節(jié)點(diǎn)之間的高帶寬、低延遲通信。與傳統(tǒng)在節(jié)點(diǎn)內(nèi)和節(jié)點(diǎn)間分別采用不同協(xié)議構(gòu)建網(wǎng)絡(luò)的方式相比，這種同構(gòu)互聯(lián)架構(gòu)減少了協(xié)議轉(zhuǎn)換帶來的額外開銷，也簡化了系統(tǒng)部署。

在部署能力上，該架構(gòu)既可以支持單節(jié)點(diǎn)數(shù)十卡規(guī)模擴(kuò)展，也能夠平滑擴(kuò)展至千卡級集群規(guī)模，從而適配不同規(guī)模的AI應(yīng)用需求。

此外，針對大模型推理中KV Cache訪問帶來的壓力，系統(tǒng)在計(jì)算互聯(lián)與存儲互聯(lián)層面進(jìn)行了協(xié)同優(yōu)化。通過計(jì)算網(wǎng)絡(luò)與存儲網(wǎng)絡(luò)的聯(lián)合調(diào)度，可以顯著提升數(shù)據(jù)讀取效率，使模型在長上下文推理場景下依然保持穩(wěn)定性能。

通過芯片架構(gòu)、網(wǎng)絡(luò)互聯(lián)以及系統(tǒng)調(diào)度等多層優(yōu)化，這一推理集群在整體效率與成本控制方面形成了明顯優(yōu)勢，為AI規(guī)?；瘧?yīng)用提供了更加經(jīng)濟(jì)的算力方案。

據(jù)悉，本次AI推理集群將分三期建設(shè)，并全部采用云天勵(lì)飛自研的國產(chǎn)AI推理加速卡。其中，一期項(xiàng)目將部署云天勵(lì)飛X6000推理加速卡；二、三期建設(shè)將率先搭載公司最新一代芯片產(chǎn)品。

根據(jù)公司規(guī)劃，未來三年云天勵(lì)飛將推出三代AI推理芯片產(chǎn)品。第一階段，將推出面向長上下文場景優(yōu)化的Prefill芯片，通過提升計(jì)算效率與內(nèi)存訪問能力，為各類AI Agent提供基礎(chǔ)算力支撐；第二階段，將研發(fā)專注于Decode階段低延遲優(yōu)化的芯片產(chǎn)品，進(jìn)一步提升實(shí)時(shí)推理能力；第三階段，則通過系統(tǒng)級協(xié)同優(yōu)化，實(shí)現(xiàn)Prefill與Decode性能的整體提升，向毫秒級推理時(shí)延目標(biāo)邁進(jìn)。

其中，首款Prefill芯片DeepVerse100預(yù)計(jì)將在年內(nèi)完成流片，并計(jì)劃在湛江集群中率先部署。在更長期的規(guī)劃中，云天勵(lì)飛提出“1001計(jì)劃”，即以“百億Token一分錢”為長期目標(biāo)，通過芯片與系統(tǒng)協(xié)同優(yōu)化持續(xù)降低大模型推理成本。

在業(yè)內(nèi)看來，推理算力將成為決定AI應(yīng)用規(guī)?；涞氐年P(guān)鍵基礎(chǔ)設(shè)施。誰能夠以更高效率、更低成本提供穩(wěn)定的大規(guī)模推理能力，誰就有機(jī)會在新一輪人工智能產(chǎn)業(yè)競爭中占據(jù)先機(jī)。湛江AI推理千卡集群的建設(shè)，不僅為當(dāng)?shù)禺a(chǎn)業(yè)數(shù)字化轉(zhuǎn)型提供了重要算力底座，也為國產(chǎn)模型與國產(chǎn)芯片協(xié)同發(fā)展提供了實(shí)踐場景。

（編輯張偉）

-證券日報(bào)網(wǎng)

熱點(diǎn)新聞

優(yōu)供給穩(wěn)預(yù)期繪就房地產(chǎn)發(fā)展新畫卷

政府工作報(bào)告首提“智能經(jīng)濟(jì)” 代表委員共話發(fā)展新圖景

儲能產(chǎn)業(yè)開啟“價(jià)值創(chuàng)造”新篇章

機(jī)床上市企業(yè)加碼核心技術(shù)高端化升級

24小時(shí)排行一周排行

深度策劃

新一輪以舊換新落地激發(fā)消費(fèi)新動(dòng)能

首先，一些地方在出臺與消費(fèi)品以舊換新相關(guān)的……[詳情]

市場快訊

12:29	科力遠(yuǎn)館陶電站完成核心設(shè)備交付 ...
12:03	云天勵(lì)飛千卡AI推理集群落地
11:32	中國保險(xiǎn)行業(yè)協(xié)會編撰出版《保險(xiǎn)業(yè)...
11:24	榮耀發(fā)布新款折疊屏Magic V6
10:55	中國建材集團(tuán)碳纖維技術(shù)實(shí)現(xiàn)重大超...
10:55	京東方聯(lián)合創(chuàng)維發(fā)布新品加速布局...
00:22	今年首批儲蓄國債認(rèn)購火熱
00:22	消費(fèi)市場春意盎然：“花經(jīng)濟(jì)”綻放...
00:22	多地官宣新一輪消費(fèi)券激活春日經(jīng)濟(jì)
00:22	國鐵集團(tuán)：前兩個(gè)月全國鐵路完成固...
00:22	油價(jià)上漲傳導(dǎo)至航空業(yè) 多家航司宣...
00:22	國際油價(jià)高位震蕩化工品價(jià)格普漲