?作者:馬曉亮(中國(guó)電信廣東公司)
2023年至今,當(dāng)人們還為ChatGPT的“智力爆炸”驚嘆時(shí),DeepSeek以開(kāi)源之名撕開(kāi)了AI高墻的第一道裂縫。不管怎么議論, 它已攪動(dòng)了一池AI春水,看似技術(shù)路線的選擇,實(shí)則暗藏著信息權(quán)力、技術(shù)權(quán)力、資本游戲、地緣政治的劇烈碰撞,進(jìn)而讓全球圍觀了美科技股暴跌。
從工程開(kāi)發(fā)角度看中美兩國(guó)模型構(gòu)建思路
應(yīng)該說(shuō)一直到現(xiàn)在,美國(guó)仍引領(lǐng)整個(gè)信息技術(shù)進(jìn)程,使得美國(guó)建立的信息架構(gòu)成為全世界的標(biāo)準(zhǔn)。最初,在AI模型構(gòu)建時(shí),也遵循這個(gè)規(guī)律。模型構(gòu)建,開(kāi)發(fā)者要考慮各種資源的成本平衡問(wèn)題,涉及到軟件的實(shí)現(xiàn)、計(jì)算能力、存儲(chǔ)能力、網(wǎng)絡(luò)帶寬成本、編程的人工成本及其他。
工程實(shí)現(xiàn),需要根據(jù)不同資源的成本差異,設(shè)計(jì)匹配方案。如果編程人工成本和管理成本高,計(jì)算和存儲(chǔ)能力的獲得相對(duì)較低,就會(huì)傾向于簡(jiǎn)單的編程算法去實(shí)現(xiàn),是硬件依賴型算法。如果硬件成本相對(duì)高,就得通過(guò)更為復(fù)雜的編程去盡可能節(jié)省計(jì)算和存儲(chǔ)的硬件資源。實(shí)現(xiàn)相同目標(biāo)的技術(shù)路徑和方案可以有很多選擇,考慮到成本的綜合平衡,不能簡(jiǎn)單地說(shuō)哪種算法或策略較好。
選擇不同的技術(shù)方案,也體現(xiàn)不同的文化。我本科是在天津南開(kāi)讀的,電子信息專業(yè);碩士是美國(guó)讀的,計(jì)算數(shù)學(xué)專業(yè);讀完后在美工作一年多,編程工程師;博士又回到國(guó)內(nèi)西電讀,電子信息,應(yīng)該說(shuō)對(duì)中美兩國(guó)的信息技術(shù)架構(gòu)建設(shè)思路都了解。美國(guó)在引領(lǐng)信息技術(shù)發(fā)展的過(guò)程中,逐步地形成了他們特定的文化,不關(guān)注計(jì)算效率最優(yōu)化,主要關(guān)注編程的方便性、簡(jiǎn)潔性、可讀性等。
形成這種文化還有另一個(gè)原因:在整個(gè)信息技術(shù)架構(gòu)中,硬件公司有行業(yè)標(biāo)準(zhǔn)控制能力,擁有更大的話語(yǔ)權(quán)。CPU是INTEL等公司生產(chǎn)的,所謂的WINTEL聯(lián)盟,就是INTEL和微軟兩家公司形成一種默契,INTEL會(huì)說(shuō)服微軟根本不用關(guān)注軟件的計(jì)算效率,交給INTEL解決;微軟也樂(lè)于關(guān)注編程的簡(jiǎn)單性和用戶界面的友好性。在這種文化演變下,計(jì)算效率就有巨大的改進(jìn)空間。人工智能時(shí)代,英偉達(dá)與OpenAI也有類似軟硬件新關(guān)系。應(yīng)該說(shuō),所有技術(shù)改進(jìn),提升計(jì)算效率的方法,美國(guó)人都知道,甚至大多數(shù)都是他們最先提出來(lái)的,但由于文化差異,甚至因?yàn)樯虡I(yè)因素,他們不會(huì)去充分利用這些技術(shù),在一定條件下還會(huì)人為降低硬件使用效率,這也是DeepSeek可以將模型計(jì)算效率提升的可能性所在。
運(yùn)營(yíng)商客服AI技術(shù)方案選擇
這三年,運(yùn)營(yíng)商在客服領(lǐng)域大量使用AI技術(shù),隨著大語(yǔ)言模型的迅猛發(fā)展, AI核心要素(算法、數(shù)據(jù)和算力)面臨新的挑戰(zhàn)。不同的垂域AI服務(wù),如何提升細(xì)分模型推理輸出精度;在BP級(jí)數(shù)據(jù)吞吐場(chǎng)景下,如何避免數(shù)據(jù)擁塞、加速存取以減少模型推理時(shí)長(zhǎng);模型對(duì)網(wǎng)絡(luò)、算力要求幾何級(jí)激增,如何最優(yōu)化云網(wǎng)算力資源匹配多任務(wù)并行?;谝陨蠁?wèn)題的工程創(chuàng)新,中國(guó)電信取得一定的成果,我所主導(dǎo)的“面向智能客服知識(shí)推薦的垂域模型關(guān)鍵技術(shù)研發(fā)及產(chǎn)業(yè)化應(yīng)用”項(xiàng)目獲2024年吳文俊人工智能科技進(jìn)步二等獎(jiǎng)。該項(xiàng)目所選取的技術(shù)路線,例如高效訓(xùn)練推理協(xié)同模型、異構(gòu)算力的任務(wù)-算力關(guān)聯(lián)匹配方法、云網(wǎng)協(xié)同的異構(gòu)混合算力調(diào)度方法等,都近似DeepSeek的技術(shù)路徑,遵循中國(guó)式的“優(yōu)化編程、減少硬件資源占用”文化。
項(xiàng)目特色及實(shí)現(xiàn)路徑
1、漸進(jìn)式知識(shí)演化機(jī)制:研發(fā)帶遺忘因子的參數(shù)演化算法實(shí)現(xiàn)敏捷迭代:①動(dòng)態(tài)知識(shí)圖譜:構(gòu)建電信業(yè)務(wù)變更檢測(cè)模型,自動(dòng)識(shí)別3大類12小類規(guī)則變動(dòng)。②增量學(xué)習(xí)框架:采用參數(shù)重要性評(píng)估矩陣,僅更新12%的關(guān)鍵參數(shù)(傳統(tǒng)方法需全量更新)。③安全回滾機(jī)制:建立模型版本沙箱環(huán)境,支持72小時(shí)內(nèi)異常工況回溯。該機(jī)制使新業(yè)務(wù)上線適應(yīng)周期從14天縮短至8天,規(guī)則變更引發(fā)的工單錯(cuò)誤率下降40%。
2、人機(jī)協(xié)同增強(qiáng)回路:構(gòu)建四維坐席能力評(píng)價(jià)體系(響應(yīng)速度、解決率、話術(shù)規(guī)范、客戶情緒引導(dǎo)),通過(guò)以下方法實(shí)現(xiàn)持續(xù)優(yōu)化:①對(duì)話過(guò)程實(shí)時(shí)拆解:將優(yōu)秀服務(wù)案例轉(zhuǎn)化為帶時(shí)空標(biāo)記的訓(xùn)練樣本。②反事實(shí)增強(qiáng)學(xué)習(xí):生成“如果…會(huì)更好”的對(duì)比訓(xùn)練數(shù)據(jù)。③個(gè)性化模型微調(diào):為T(mén)OP20%的坐席構(gòu)建專屬推理模型。該持續(xù)優(yōu)化閉環(huán),使得座席培養(yǎng)周期從3個(gè)月壓縮到2個(gè)月,金牌座席經(jīng)驗(yàn)復(fù)制效率提升30%。
圖1:項(xiàng)目組開(kāi)展課題研發(fā)攻關(guān)
圖2:項(xiàng)目組自研客服AI大腦(2023年)
實(shí)際應(yīng)用場(chǎng)景及效果
1、客服效率的提升:項(xiàng)目選取廣州電信客服場(chǎng)景,結(jié)合用戶基數(shù)龐大和語(yǔ)料數(shù)據(jù)標(biāo)準(zhǔn)化程度高的優(yōu)勢(shì),構(gòu)建標(biāo)準(zhǔn)化數(shù)據(jù)底座,調(diào)用中國(guó)電信星辰大模型研發(fā)細(xì)分行業(yè)模型,實(shí)現(xiàn)垂域數(shù)據(jù)治理與業(yè)務(wù)場(chǎng)景深度耦合;依托輕量化技術(shù)路線突破消費(fèi)級(jí)硬件算力瓶頸,異構(gòu)調(diào)度效率提升15%、成本降低70%;以“資源優(yōu)化+場(chǎng)景定制”的雙輪驅(qū)動(dòng)模式,為行業(yè)提供了可復(fù)制的AI轉(zhuǎn)型閉環(huán)范式。
項(xiàng)目之初,客服工作大量依托人力處理,日均處理3000投訴工單,派單、打單、質(zhì)檢處理效率低且人為出錯(cuò)頻發(fā),為解決坐席人員流動(dòng)高,培訓(xùn)耗時(shí)且難以適應(yīng)電信業(yè)務(wù)更替頻繁的問(wèn)題,決心建設(shè)垂域模型,輔助坐席,落實(shí)電話業(yè)務(wù)問(wèn)答、知識(shí)跟隨能力;又伴隨著300多話務(wù)人員知識(shí)問(wèn)答對(duì)算力的極大消耗和初期只有英偉達(dá)4090等消費(fèi)級(jí)顯卡的困境,以最小的算力完成最大化任務(wù),著手解決本地化算力AI調(diào)度問(wèn)題。至2025年,平臺(tái)穩(wěn)定運(yùn)行三年余,話務(wù)員工作效率提升15%,平均每份工單處理時(shí)間從20分鐘縮減至17分鐘,總工單處理能力增長(zhǎng)19.7%,工單處理及時(shí)性提高11.1%。
2、成本的大幅降低:初期,面臨人力成本和算力資源有限的雙重挑戰(zhàn),通過(guò)研發(fā)知識(shí)演化機(jī)制,人機(jī)協(xié)同增強(qiáng)等技術(shù),顯著降低人力和系統(tǒng)運(yùn)營(yíng)成本。
派單人力成本減少了70%,話務(wù)運(yùn)營(yíng)團(tuán)隊(duì)規(guī)模縮減了16.5%。同時(shí),借助云網(wǎng)協(xié)同的異構(gòu)混合算力調(diào)度方法,我們?cè)谟邢薜挠布Y源下實(shí)現(xiàn)了任務(wù)的高效處理,節(jié)省了大量的硬件投資。
3、客戶滿意度的提升:通過(guò)AI技術(shù)的引入,客戶的整體滿意度得到了顯著提升。項(xiàng)目實(shí)施后,客戶滿意度上升了3.1個(gè)百分點(diǎn),工單重復(fù)投訴率下降了0.7個(gè)百分點(diǎn)。
這些成果不僅體現(xiàn)AI技術(shù)的先進(jìn)性,更反映工程開(kāi)發(fā)對(duì)客戶需求的深刻理解。
圖3:項(xiàng)目落地現(xiàn)場(chǎng)
對(duì)DeepSeek的幾點(diǎn)思考和啟示
1、DeepSeek r1并沒(méi)有顯著超越早期模型的智能水平,其最大優(yōu)勢(shì)在于訓(xùn)練過(guò)程中的成本大幅降低,而并非在智能表現(xiàn)上有質(zhì)的飛躍。
2、DeepSeek的出現(xiàn)并不意味著中國(guó)在AI技術(shù)上超越了美國(guó)。不過(guò),它在工程設(shè)計(jì)上的優(yōu)秀表現(xiàn)為其贏得了競(jìng)爭(zhēng)中的一席之地。
3、Nvidia在GPU市場(chǎng)的領(lǐng)先地位正面臨挑戰(zhàn),隨著價(jià)格戰(zhàn)的到來(lái),市場(chǎng)的調(diào)整似乎是不可避免的。盡管如此,Nvidia的威脅并不意味著它將被完全取代,畢竟高端GPU仍然有需求。運(yùn)營(yíng)商如何有效規(guī)避美國(guó)GPU出口限制,更高效運(yùn)用已有算力資源,成為當(dāng)前主要任務(wù)。
4、DeepSeek是一次經(jīng)濟(jì)革命和地緣政治的警鐘,它的成功可能影響全球AI產(chǎn)業(yè)格局,但它并未解決AI的根本難題。
同時(shí),三大運(yùn)營(yíng)商都對(duì)基礎(chǔ)設(shè)施、模型投入了大量資金,卻產(chǎn)出有限,算力使用率僅為15%,相當(dāng)于做了英偉達(dá)的囤貨商,又面臨著算力需求的急速壓縮。
DeepSeek崛起不僅是中國(guó)AI技術(shù)的重要突破,也是全球AI產(chǎn)業(yè)格局的重大變化。它帶來(lái)了成本的大幅下降,給傳統(tǒng)AI巨頭帶來(lái)了更大的競(jìng)爭(zhēng)壓力。我們并不驚訝看到,更少的計(jì)算就能實(shí)現(xiàn)相當(dāng)或更強(qiáng)大的功能,推理成本下降是人工智能改進(jìn)的標(biāo)志。據(jù)估計(jì),算法的進(jìn)步速度為每年 4 倍,這意味著每過(guò)一年,實(shí)現(xiàn)相同功能所需的計(jì)算量就會(huì)減少 4 倍。Anthropic 首席執(zhí)行官 Dario 認(rèn)為,算法的進(jìn)步速度更快,可以帶來(lái)10 倍的改進(jìn)。例如,就 GPT-3推理定價(jià)而言,成本已下降了 1200 倍。需要明確的是,目前,DeepSeek 的獨(dú)特之處在于最優(yōu)化實(shí)現(xiàn)成本-功能水平,之前的 Mistral 和 Llama 型號(hào)階段性也做到了這一點(diǎn)。
正當(dāng) R1 被瘋狂炒作時(shí),谷歌剛剛發(fā)布了一款更便宜的推理模型:Gemini Flash 2.0 Thinking。該模型比 R1 便宜得多,能夠通過(guò) API 為模型輸入更大的上下文長(zhǎng)度。根據(jù)報(bào)告的基準(zhǔn)測(cè)試,F(xiàn)lash 2.0 Thinking 擊敗了 R1,盡管基準(zhǔn)測(cè)試并不能說(shuō)明全部情況。Google 的模式很強(qiáng)大,在許多方面都與 R1 相媲美,但并沒(méi)有受到任何炒作。這可能是因?yàn)?Google 的市場(chǎng)策略乏善可陳,用戶體驗(yàn)不佳,且 R1 是來(lái)自中國(guó)的驚喜。
沒(méi)有誰(shuí)能夠在這場(chǎng)風(fēng)暴中獨(dú)善其身,不管是這次吳獎(jiǎng)的垂域模型構(gòu)建,或是DeepSeek的破局,再到谷歌Gemini Flash 2.0,都是讓AI不再神秘。當(dāng)開(kāi)源模型在GitHub上自由流動(dòng),個(gè)人開(kāi)發(fā)者只關(guān)注基礎(chǔ)模型的性能和算力要求,用千元級(jí)顯卡就跑出企業(yè)級(jí)應(yīng)用,“技術(shù)平權(quán)”得到最貼切的詮釋。DeepSeek撕開(kāi)的這道裂縫,永遠(yuǎn)不會(huì)閉合,AI不再是少數(shù)人的權(quán)杖,而是照亮每個(gè)角落的光。
(責(zé)任編輯:康玲華)
??????????????????????????????????????????????????????運(yùn)營(yíng)商財(cái)經(jīng)(官方微信公眾號(hào)yyscjrd)—— 主流財(cái)經(jīng)網(wǎng)站,一家全面覆蓋科技、金融、證券、汽車(chē)、房產(chǎn)、食品、醫(yī)藥、日化、酒業(yè)及其他各種消費(fèi)品網(wǎng)站。