優(yōu)選機(jī)房

成都服務(wù)器托管/電信西信機(jī)房
中國電信西部信息中心

低至450.00元/月起

成都服務(wù)器托管/珉田雙線機(jī)房
四川珉田(大邑)數(shù)據(jù)中心

低至4500.00元/月起

成都服務(wù)器托管/川西大數(shù)據(jù)機(jī)房
四川雅安川西大數(shù)據(jù)中心

低至4500.00元/月起

成都服務(wù)器托管/溫江中立機(jī)房
四川中立(溫江)數(shù)據(jù)中心

低至350.00元/月起

成都服務(wù)器托管/電信棕樹機(jī)房
中國電信棕樹數(shù)據(jù)中心

低至400.00元/月起

機(jī)房
U位
帶寬
IP
算一算價(jià)格

國產(chǎn)人工智能算力平臺(tái)大突破!華為NPU,訓(xùn)練準(zhǔn)萬億參數(shù)大模型

發(fā)布日期:

2025-05-08 14:52:49

本文鏈接

http://www.bbswl.cn//industry/2726.html

本文關(guān)鍵詞

GPU算力平臺(tái)

華為昇騰NPU集群突破萬億參數(shù)大模型訓(xùn)練壁壘,6000+芯片實(shí)現(xiàn)718B參數(shù)MoE模型穩(wěn)定訓(xùn)練,算力利用率提升58.7%!純國產(chǎn)硬件絲滑攻克負(fù)載均衡、通信墻等四大技術(shù)難關(guān),硬核黑科技讓英偉達(dá)GPU黯然失色。


image


華為昇騰已經(jīng)跑通訓(xùn)練準(zhǔn)萬億參數(shù)的大模型!


以前要訓(xùn)練接近一萬億參數(shù)的模型,大家都得靠英偉達(dá)GPU才行。但華為直接在自家的昇騰(Ascend)NPU平臺(tái)上,實(shí)現(xiàn)了對(duì)7,180億參數(shù)MoE(稀疏專家模型)穩(wěn)定的長(zhǎng)時(shí)間訓(xùn)練。


最新公布的技術(shù)報(bào)告里披露,華為盤古團(tuán)隊(duì)(含諾亞方舟實(shí)驗(yàn)室和華為云)在超過6,000塊昇騰NPU組成的集群上,靠多項(xiàng)系統(tǒng)級(jí)優(yōu)化,一口氣解決了跑大模型的負(fù)載均衡、通信開銷和效率低下等“攔路虎”。


這些創(chuàng)新的優(yōu)化一上來,訓(xùn)練速度立馬嗖嗖往上漲,直接把頂尖大模型的研發(fā)給頂住了!從此,大廠也不用非得買英偉達(dá)GPU做訓(xùn)練了 —— “國產(chǎn)”兩字,在大模型硬件上砝碼越壓越重。這一成果不僅刷新國產(chǎn)算力紀(jì)錄,更標(biāo)志著我國在AI基礎(chǔ)設(shè)施領(lǐng)域已具備國際頂尖水平。


IDC觀察



IDC觀察是國內(nèi)專注AIDC與智算領(lǐng)域的垂直媒體與資源服務(wù)平臺(tái),依托公眾號(hào)、品牌小程序及用戶共享生態(tài),構(gòu)建“內(nèi)容+工具+社區(qū)”的全媒體矩陣,提供行業(yè)前沿資訊、全國機(jī)房及算力資源實(shí)時(shí)查詢共享服務(wù),精準(zhǔn)連接數(shù)據(jù)中心運(yùn)營(yíng)商、算力需求方及行業(yè)從業(yè)者。

image

優(yōu)選機(jī)房

成都服務(wù)器托管/電信西信機(jī)房
中國電信西部信息中心

低至450.00元/月起

成都服務(wù)器托管/珉田雙線機(jī)房
四川珉田(大邑)數(shù)據(jù)中心

低至4500.00元/月起

成都服務(wù)器托管/川西大數(shù)據(jù)機(jī)房
四川雅安川西大數(shù)據(jù)中心

低至4500.00元/月起

成都服務(wù)器托管/溫江中立機(jī)房
四川中立(溫江)數(shù)據(jù)中心

低至350.00元/月起

成都服務(wù)器托管/電信棕樹機(jī)房
中國電信棕樹數(shù)據(jù)中心

低至400.00元/月起