證券日報APP

掃一掃
下載客戶端

您所在的位置: 網(wǎng)站首頁 > 評論頻道 > 產經評論 > 正文

大模型“百軻爭流” 唯有“奮楫者”才能揚帆遠航

2023-07-10 00:40  來源:證券日報 

    賈麗

    近日,在多場重要的科技盛會上,大模型均占C位。數(shù)十個大模型悉數(shù)登場,相關應用在各行業(yè)逐步垂直滲透,數(shù)字人、智能艙等“百花齊放”。國內多模態(tài)等各類大模型技術路線并行突破,產業(yè)鏈芯片、算力等關鍵技術市場蓬勃發(fā)展,更多企業(yè)聯(lián)合探路。

    隨著在國內熱度持續(xù)上漲,大模型“百軻爭流”,呈現(xiàn)蓬勃發(fā)展態(tài)勢??萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心發(fā)布報告顯示,上半年我國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。根據(jù)上海市人工智能學會數(shù)據(jù),截至目前,我國大模型已近百個,可謂真正進入了“百模大戰(zhàn)”。下半年國內還將進入大模型發(fā)布的密集期。

    熱鬧之下,國內大模型也必須直面靈魂拷問。

    首先,能否燒得起?大模型需要龐大的算力支持,同時也帶來巨大的成本壓力。有專家直言,ChatGPT大模型每訓練一次,相當于報廢了3000輛特斯拉汽車。眾多企業(yè)陷入一邊瘋狂燒錢短期內難以覆蓋預訓練成本,一邊模型商業(yè)化難以落地的困境之中。

    其次,可否規(guī)模商用?當下大模型仍有局限性,存在效率低、涉嫌侵犯數(shù)據(jù)隱私和知識產權、高端人才匱乏等問題。業(yè)內認為,大模型效率需得到10倍以上的提高,大規(guī)模商用才有可能。

    再次,如何避免過度?在龐大的模型數(shù)量和種類之下,存在一些過度現(xiàn)象。部分企業(yè)追求炫技忽視應用可行性,部分追求模型“規(guī)模大”而堆疊參數(shù),更有部分企業(yè)或機構追求“參數(shù)高”過度訓練,導致大模型過擬合和泛化能力不足。

    面對挑戰(zhàn),國內大模型“航船”該如何順利“渡江”?

    其一,注重前端技術,勇攀“芯”高峰,深耕算力。企業(yè)在關鍵技術道路上勤耕不輟,探索新的預訓練架構、方法,進一步提升大模型的性能和效率,推動國內大模型與國際接軌,讓大模型真正成為企業(yè)參與全球AI大模型競爭的重磅“船票”。鼓勵創(chuàng)新創(chuàng)業(yè),讓開發(fā)者設施可以站在巨頭肩膀上創(chuàng)造未來。

    其二,推動產業(yè)鏈聯(lián)動,擴大開放開源生態(tài)。大模型熱帶來了算力、國產芯“創(chuàng)新架構+開源生態(tài)”的新機會。行業(yè)通過共建開放生態(tài),鼓勵產業(yè)鏈共享和合作,從而減少重復建模。企業(yè)也可通過收購、孵化等方式,擴大自身在行業(yè)影響力和市場份額。

    其三,加強模型評估和驗證。機構及企業(yè)應建立評估標準和機制,規(guī)范模型開發(fā)和應用過程,避免過度夸大模型的能力,防止炒作,注重大模型可解釋性和可理解性,使其在實際應用中更加可信、可靠。

    大模型“百軻爭流”后是大浪淘沙,只有真正的“奮楫者”,才可以勇立潮頭揚帆遠航。

-證券日報網(wǎng)
  • 24小時排行 一周排行

版權所有證券日報網(wǎng)

互聯(lián)網(wǎng)新聞信息服務許可證 10120180014增值電信業(yè)務經營許可證B2-20181903

京公網(wǎng)安備 11010202007567號京ICP備17054264號

證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務請仔細閱讀法律申明,風險自負。

證券日報社電話:010-83251700網(wǎng)站電話:010-83251800

網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net

證券日報APP

掃一掃,即可下載

官方微信

掃一掃,加關注

官方微博

掃一掃,加關注