本報(bào)訊(記者賈麗)近日,聯(lián)想集團(tuán)有限公司(以下簡稱“聯(lián)想”)宣布基于聯(lián)想問天WA7780 G3服務(wù)器,在行業(yè)內(nèi)首次實(shí)現(xiàn)單機(jī)部署DeepSeek-R1/V3 671B大模型,以低于行業(yè)公認(rèn)1TB顯存(實(shí)際768GB)承載多并發(fā)用戶流暢體驗(yàn),可以滿足千人企業(yè)的使用需求,為行業(yè)樹立了企業(yè)級(jí)大模型部署新基準(zhǔn)。
作為全球關(guān)注的焦點(diǎn),眾多企業(yè)正準(zhǔn)備在本地化部署DeepSeek大模型。然而,在落地實(shí)施過程中用戶普遍面臨以下關(guān)鍵決策難題:單機(jī)能否部署滿血版DeepSeek R1?如何確保高并發(fā)與吞吐量下的優(yōu)質(zhì)體驗(yàn)?
聯(lián)想此次突破為企業(yè)提供科學(xué)選型指南。針對行業(yè)公認(rèn)1TB顯存是千億參數(shù)大模型運(yùn)行基線,聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群和研究院ICI實(shí)驗(yàn)室組成的聯(lián)合攻關(guān)團(tuán)隊(duì)通過專家并行優(yōu)化、智能訪存架構(gòu)升級(jí)等,大幅提升顯存利用率,實(shí)現(xiàn)性能的提升。
據(jù)了解,聯(lián)想問天WA7780 G3服務(wù)器在2月初已實(shí)現(xiàn)單機(jī)768GB GPU顯存條件下部署DeepSeek 671B R1和V3滿血模型,并能滿足中小企業(yè)的并發(fā)需求,通過聯(lián)想萬全異構(gòu)智算平臺(tái)的訪存優(yōu)化等技術(shù)優(yōu)化手段,實(shí)現(xiàn)單機(jī)一個(gè)月內(nèi)并發(fā)能力增長10倍。
業(yè)內(nèi)認(rèn)為,聯(lián)想技術(shù)突破將有效破除大模型落地瓶頸,顯著加速大模型在企業(yè)的落地進(jìn)程。
聯(lián)想負(fù)責(zé)人表示,聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群與聯(lián)想研究院ICI實(shí)驗(yàn)室將繼續(xù)合作,依托雙方聯(lián)合打造的聯(lián)想萬全異構(gòu)智算平臺(tái)對DeepSeek平臺(tái)從AI預(yù)訓(xùn)練、后訓(xùn)練到推理的全流程進(jìn)行持續(xù)優(yōu)化,加速大模型的落地。
(編輯 張明富)
多地召開“新春第一會(huì)” 高質(zhì)量發(fā)展、改革創(chuàng)新等被“置頂”
隨著春節(jié)假期結(jié)束,全國多地在蛇年首個(gè)工作……[詳情]
版權(quán)所有《證券日報(bào)》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號(hào)京ICP備19002521號(hào)
證券日報(bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。
證券日報(bào)社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注