隨著各行各業(yè)加速接入國(guó)產(chǎn)開源大模型DeepSeek,如何應(yīng)對(duì)人工智能大范圍落地應(yīng)用帶來的龐大算力需求,成為當(dāng)下國(guó)內(nèi)算力產(chǎn)業(yè)必須面對(duì)的機(jī)遇與挑戰(zhàn)。在這樣的大背景下,昇騰大EP(專家并行)推理方案憑借其獨(dú)特的技術(shù)優(yōu)勢(shì),為DeepSeek的高效部署與產(chǎn)業(yè)落地提供了新思路。
專家并行成大模型趨勢(shì)
業(yè)內(nèi)人士認(rèn)為,隨著人工智能技術(shù)的加速演進(jìn),大模型正沿著“技術(shù)摸高”與“工程創(chuàng)新”兩條路徑并行發(fā)展。而DeepSeek正是“工程創(chuàng)新”的典型,憑借其卓越的性能表現(xiàn)、顯著降低的算力成本以及積極的開源策略,加速推動(dòng)大模型技術(shù)的廣泛普及與快速迭代。
DeepSeek的創(chuàng)新路徑表明,大模型不再僅僅依賴少量大專家(Large Experts),而是向大量小專家(Small Experts)方向演進(jìn)。通過大規(guī)模專家并行(EP)技術(shù),模型可以將計(jì)算任務(wù)分配至更多的計(jì)算資源上,從而減少單卡顯存占用,提高計(jì)算吞吐量,并有效降低推理時(shí)延。
這一變化極大降低了企業(yè)部署大模型的門檻,在算力有限的情況下也能通過合理優(yōu)化運(yùn)行高效的AI推理任務(wù)。此外,DeepSeek開創(chuàng)了全新的數(shù)據(jù)訓(xùn)練模式,結(jié)合基礎(chǔ)模型生成的高質(zhì)量合成數(shù)據(jù)與少量行業(yè)數(shù)據(jù),即可訓(xùn)練出高性能行業(yè)模型,使企業(yè)不再受限于數(shù)據(jù)積累的不足。同時(shí),DeepSeek的開源策略進(jìn)一步降低了行業(yè)準(zhǔn)入門檻,推動(dòng)AI技術(shù)的廣泛應(yīng)用。
昇騰大EP求解技術(shù)難題
盡管DeepSeek通過優(yōu)化算法顯著降低算力需求,但因其高性價(jià)比助推AI普及,使得算力需求反而呈現(xiàn)指數(shù)級(jí)膨脹。與此同時(shí),大規(guī)模專家并行(EP)技術(shù)雖然能夠降低成本,但在實(shí)際應(yīng)用中仍面臨專家動(dòng)態(tài)均衡與通信時(shí)延等挑戰(zhàn)。
業(yè)內(nèi)專家指出,優(yōu)化負(fù)載均衡、縮減通信成本以及高效利用資源,是當(dāng)前DeepSeek等大模型在行業(yè)應(yīng)用中亟待解決的技術(shù)難題。針對(duì)這些難題,昇騰大EP推理方案通過軟硬件優(yōu)化,進(jìn)一步提升了推理效率,實(shí)現(xiàn)了更高性能、更低時(shí)延以及更優(yōu)性價(jià)比。
據(jù)介紹,在大規(guī)模專家并行趨勢(shì)下,昇騰大EP推理方案實(shí)現(xiàn)了四大關(guān)鍵技術(shù)突破:
一是提升并發(fā)能力。通過專家并行優(yōu)化,昇騰方案顯著降低單卡顯存占用,并提升單卡并發(fā)能力至3倍,使企業(yè)能夠在相同算力投入下獲得更高推理吞吐量。
二是MoE負(fù)載均衡。通過自動(dòng)尋優(yōu)、自動(dòng)預(yù)測(cè)、自動(dòng)配比等技術(shù),確保專家計(jì)算任務(wù)的均衡分布,優(yōu)化推理效率。
三是創(chuàng)新的autoPD分離部署方案??梢宰詣?dòng)感知負(fù)載變化,動(dòng)態(tài)調(diào)整Prefill(預(yù)填充)與Decode(解碼)實(shí)例的資源分配,使系統(tǒng)吞吐量提升50%以上。
四是通信優(yōu)化與算子融合。采用雙流/多維混合并行計(jì)算,以及MLAPO融合算子,將計(jì)算、通信和權(quán)重加載任務(wù)優(yōu)化并行處理,減少計(jì)算開銷,提高推理速度。
這些技術(shù)突破,使昇騰大EP推理方案能夠在保證高效推理的同時(shí),大幅降低企業(yè)部署成本,為DeepSeek等大模型大規(guī)模應(yīng)用提供更穩(wěn)定、更經(jīng)濟(jì)的AI推理基礎(chǔ)設(shè)施。
加速行業(yè)智能化升級(jí)
DeepSeek與昇騰的協(xié)同創(chuàng)新效應(yīng)正在加速溢出。據(jù)了解,三大運(yùn)營(yíng)商智算平臺(tái)已全面接入昇騰優(yōu)化的DeepSeek模型,全國(guó)超70%區(qū)域可獲取服務(wù);廣州、深圳、鄭州等地的政務(wù)云平臺(tái)已實(shí)現(xiàn)基于昇騰的DeepSeek部署,覆蓋智能客服、政策解讀等場(chǎng)景;教育、制造等行業(yè)也通過基于昇騰打造的一體機(jī)方案,完成DeepSeek私有化部署。
業(yè)內(nèi)人士認(rèn)為,昇騰大EP推理方案的成功應(yīng)用,標(biāo)志著中國(guó)AI算力生態(tài)正從“單點(diǎn)突破”邁向“體系重構(gòu)”。相關(guān)測(cè)算顯示,DeepSeek模型在昇騰平臺(tái)上的推理成本僅為傳統(tǒng)方案的三分之一,將加速大模型在行業(yè)中的落地,帶動(dòng)行業(yè)智能化走深向?qū)?,?gòu)建起自主創(chuàng)新的AI基礎(chǔ)設(shè)施。