Deep Seek現(xiàn)象的啟示-——運(yùn)營(yíng)商所面臨的困境

2025-02-06 12:14

?作者：馬曉亮（中國(guó)電信廣東公司）

2023年至今，當(dāng)人們還為ChatGPT的“智力爆炸”驚嘆時(shí)，DeepSeek以開(kāi)源之名撕開(kāi)了AI高墻的第一道裂縫。不管怎么議論，它已攪動(dòng)了一池AI春水，看似技術(shù)路線的選擇，實(shí)則暗藏著信息權(quán)力、技術(shù)權(quán)力、資本游戲、地緣政治的劇烈碰撞，進(jìn)而讓全球圍觀了美科技股暴跌。

從工程開(kāi)發(fā)角度看中美兩國(guó)模型構(gòu)建思路

應(yīng)該說(shuō)一直到現(xiàn)在，美國(guó)仍引領(lǐng)整個(gè)信息技術(shù)進(jìn)程，使得美國(guó)建立的信息架構(gòu)成為全世界的標(biāo)準(zhǔn)。最初，在AI模型構(gòu)建時(shí)，也遵循這個(gè)規(guī)律。模型構(gòu)建，開(kāi)發(fā)者要考慮各種資源的成本平衡問(wèn)題，涉及到軟件的實(shí)現(xiàn)、計(jì)算能力、存儲(chǔ)能力、網(wǎng)絡(luò)帶寬成本、編程的人工成本及其他。

工程實(shí)現(xiàn)，需要根據(jù)不同資源的成本差異，設(shè)計(jì)匹配方案。如果編程人工成本和管理成本高，計(jì)算和存儲(chǔ)能力的獲得相對(duì)較低，就會(huì)傾向于簡(jiǎn)單的編程算法去實(shí)現(xiàn)，是硬件依賴型算法。如果硬件成本相對(duì)高，就得通過(guò)更為復(fù)雜的編程去盡可能節(jié)省計(jì)算和存儲(chǔ)的硬件資源。實(shí)現(xiàn)相同目標(biāo)的技術(shù)路徑和方案可以有很多選擇，考慮到成本的綜合平衡，不能簡(jiǎn)單地說(shuō)哪種算法或策略較好。

選擇不同的技術(shù)方案，也體現(xiàn)不同的文化。我本科是在天津南開(kāi)讀的，電子信息專業(yè)；碩士是美國(guó)讀的，計(jì)算數(shù)學(xué)專業(yè)；讀完后在美工作一年多，編程工程師；博士又回到國(guó)內(nèi)西電讀，電子信息，應(yīng)該說(shuō)對(duì)中美兩國(guó)的信息技術(shù)架構(gòu)建設(shè)思路都了解。美國(guó)在引領(lǐng)信息技術(shù)發(fā)展的過(guò)程中，逐步地形成了他們特定的文化，不關(guān)注計(jì)算效率最優(yōu)化，主要關(guān)注編程的方便性、簡(jiǎn)潔性、可讀性等。

形成這種文化還有另一個(gè)原因：在整個(gè)信息技術(shù)架構(gòu)中，硬件公司有行業(yè)標(biāo)準(zhǔn)控制能力，擁有更大的話語(yǔ)權(quán)。CPU是INTEL等公司生產(chǎn)的，所謂的WINTEL聯(lián)盟，就是INTEL和微軟兩家公司形成一種默契，INTEL會(huì)說(shuō)服微軟根本不用關(guān)注軟件的計(jì)算效率，交給INTEL解決；微軟也樂(lè)于關(guān)注編程的簡(jiǎn)單性和用戶界面的友好性。在這種文化演變下，計(jì)算效率就有巨大的改進(jìn)空間。人工智能時(shí)代，英偉達(dá)與OpenAI也有類似軟硬件新關(guān)系。應(yīng)該說(shuō)，所有技術(shù)改進(jìn)，提升計(jì)算效率的方法，美國(guó)人都知道，甚至大多數(shù)都是他們最先提出來(lái)的，但由于文化差異，甚至因?yàn)樯虡I(yè)因素，他們不會(huì)去充分利用這些技術(shù)，在一定條件下還會(huì)人為降低硬件使用效率，這也是DeepSeek可以將模型計(jì)算效率提升的可能性所在。

運(yùn)營(yíng)商客服AI技術(shù)方案選擇

這三年，運(yùn)營(yíng)商在客服領(lǐng)域大量使用AI技術(shù)，隨著大語(yǔ)言模型的迅猛發(fā)展， AI核心要素（算法、數(shù)據(jù)和算力）面臨新的挑戰(zhàn)。不同的垂域AI服務(wù)，如何提升細(xì)分模型推理輸出精度；在BP級(jí)數(shù)據(jù)吞吐場(chǎng)景下，如何避免數(shù)據(jù)擁塞、加速存取以減少模型推理時(shí)長(zhǎng)；模型對(duì)網(wǎng)絡(luò)、算力要求幾何級(jí)激增，如何最優(yōu)化云網(wǎng)算力資源匹配多任務(wù)并行?；谝陨蠁?wèn)題的工程創(chuàng)新，中國(guó)電信取得一定的成果，我所主導(dǎo)的“面向智能客服知識(shí)推薦的垂域模型關(guān)鍵技術(shù)研發(fā)及產(chǎn)業(yè)化應(yīng)用”項(xiàng)目獲2024年吳文俊人工智能科技進(jìn)步二等獎(jiǎng)。該項(xiàng)目所選取的技術(shù)路線，例如高效訓(xùn)練推理協(xié)同模型、異構(gòu)算力的任務(wù)-算力關(guān)聯(lián)匹配方法、云網(wǎng)協(xié)同的異構(gòu)混合算力調(diào)度方法等，都近似DeepSeek的技術(shù)路徑，遵循中國(guó)式的“優(yōu)化編程、減少硬件資源占用”文化。

項(xiàng)目特色及實(shí)現(xiàn)路徑

1、漸進(jìn)式知識(shí)演化機(jī)制：研發(fā)帶遺忘因子的參數(shù)演化算法實(shí)現(xiàn)敏捷迭代：①動(dòng)態(tài)知識(shí)圖譜：構(gòu)建電信業(yè)務(wù)變更檢測(cè)模型，自動(dòng)識(shí)別3大類12小類規(guī)則變動(dòng)。②增量學(xué)習(xí)框架：采用參數(shù)重要性評(píng)估矩陣，僅更新12%的關(guān)鍵參數(shù)（傳統(tǒng)方法需全量更新）。③安全回滾機(jī)制：建立模型版本沙箱環(huán)境，支持72小時(shí)內(nèi)異常工況回溯。該機(jī)制使新業(yè)務(wù)上線適應(yīng)周期從14天縮短至8天，規(guī)則變更引發(fā)的工單錯(cuò)誤率下降40%。

2、人機(jī)協(xié)同增強(qiáng)回路：構(gòu)建四維坐席能力評(píng)價(jià)體系（響應(yīng)速度、解決率、話術(shù)規(guī)范、客戶情緒引導(dǎo)），通過(guò)以下方法實(shí)現(xiàn)持續(xù)優(yōu)化：①對(duì)話過(guò)程實(shí)時(shí)拆解：將優(yōu)秀服務(wù)案例轉(zhuǎn)化為帶時(shí)空標(biāo)記的訓(xùn)練樣本。②反事實(shí)增強(qiáng)學(xué)習(xí)：生成“如果…會(huì)更好”的對(duì)比訓(xùn)練數(shù)據(jù)。③個(gè)性化模型微調(diào)：為T(mén)OP20%的坐席構(gòu)建專屬推理模型。該持續(xù)優(yōu)化閉環(huán)，使得座席培養(yǎng)周期從3個(gè)月壓縮到2個(gè)月，金牌座席經(jīng)驗(yàn)復(fù)制效率提升30%。

圖1：項(xiàng)目組開(kāi)展課題研發(fā)攻關(guān)

圖2：項(xiàng)目組自研客服AI大腦（2023年）

實(shí)際應(yīng)用場(chǎng)景及效果

1、客服效率的提升：項(xiàng)目選取廣州電信客服場(chǎng)景，結(jié)合用戶基數(shù)龐大和語(yǔ)料數(shù)據(jù)標(biāo)準(zhǔn)化程度高的優(yōu)勢(shì)，構(gòu)建標(biāo)準(zhǔn)化數(shù)據(jù)底座，調(diào)用中國(guó)電信星辰大模型研發(fā)細(xì)分行業(yè)模型，實(shí)現(xiàn)垂域數(shù)據(jù)治理與業(yè)務(wù)場(chǎng)景深度耦合；依托輕量化技術(shù)路線突破消費(fèi)級(jí)硬件算力瓶頸，異構(gòu)調(diào)度效率提升15%、成本降低70%；以“資源優(yōu)化+場(chǎng)景定制”的雙輪驅(qū)動(dòng)模式，為行業(yè)提供了可復(fù)制的AI轉(zhuǎn)型閉環(huán)范式。

項(xiàng)目之初，客服工作大量依托人力處理，日均處理3000投訴工單，派單、打單、質(zhì)檢處理效率低且人為出錯(cuò)頻發(fā)，為解決坐席人員流動(dòng)高，培訓(xùn)耗時(shí)且難以適應(yīng)電信業(yè)務(wù)更替頻繁的問(wèn)題，決心建設(shè)垂域模型，輔助坐席，落實(shí)電話業(yè)務(wù)問(wèn)答、知識(shí)跟隨能力；又伴隨著300多話務(wù)人員知識(shí)問(wèn)答對(duì)算力的極大消耗和初期只有英偉達(dá)4090等消費(fèi)級(jí)顯卡的困境，以最小的算力完成最大化任務(wù)，著手解決本地化算力AI調(diào)度問(wèn)題。至2025年，平臺(tái)穩(wěn)定運(yùn)行三年余，話務(wù)員工作效率提升15%，平均每份工單處理時(shí)間從20分鐘縮減至17分鐘，總工單處理能力增長(zhǎng)19.7%，工單處理及時(shí)性提高11.1%。

2、成本的大幅降低：初期，面臨人力成本和算力資源有限的雙重挑戰(zhàn)，通過(guò)研發(fā)知識(shí)演化機(jī)制，人機(jī)協(xié)同增強(qiáng)等技術(shù)，顯著降低人力和系統(tǒng)運(yùn)營(yíng)成本。

派單人力成本減少了70%，話務(wù)運(yùn)營(yíng)團(tuán)隊(duì)規(guī)模縮減了16.5%。同時(shí)，借助云網(wǎng)協(xié)同的異構(gòu)混合算力調(diào)度方法，我們?cè)谟邢薜挠布Y源下實(shí)現(xiàn)了任務(wù)的高效處理，節(jié)省了大量的硬件投資。

3、客戶滿意度的提升：通過(guò)AI技術(shù)的引入，客戶的整體滿意度得到了顯著提升。項(xiàng)目實(shí)施后，客戶滿意度上升了3.1個(gè)百分點(diǎn)，工單重復(fù)投訴率下降了0.7個(gè)百分點(diǎn)。

這些成果不僅體現(xiàn)AI技術(shù)的先進(jìn)性，更反映工程開(kāi)發(fā)對(duì)客戶需求的深刻理解。

圖3：項(xiàng)目落地現(xiàn)場(chǎng)

對(duì)DeepSeek的幾點(diǎn)思考和啟示

1、DeepSeek r1并沒(méi)有顯著超越早期模型的智能水平，其最大優(yōu)勢(shì)在于訓(xùn)練過(guò)程中的成本大幅降低，而并非在智能表現(xiàn)上有質(zhì)的飛躍。

2、DeepSeek的出現(xiàn)并不意味著中國(guó)在AI技術(shù)上超越了美國(guó)。不過(guò)，它在工程設(shè)計(jì)上的優(yōu)秀表現(xiàn)為其贏得了競(jìng)爭(zhēng)中的一席之地。

3、Nvidia在GPU市場(chǎng)的領(lǐng)先地位正面臨挑戰(zhàn)，隨著價(jià)格戰(zhàn)的到來(lái)，市場(chǎng)的調(diào)整似乎是不可避免的。盡管如此，Nvidia的威脅并不意味著它將被完全取代，畢竟高端GPU仍然有需求。運(yùn)營(yíng)商如何有效規(guī)避美國(guó)GPU出口限制，更高效運(yùn)用已有算力資源，成為當(dāng)前主要任務(wù)。

4、DeepSeek是一次經(jīng)濟(jì)革命和地緣政治的警鐘，它的成功可能影響全球AI產(chǎn)業(yè)格局，但它并未解決AI的根本難題。

同時(shí)，三大運(yùn)營(yíng)商都對(duì)基礎(chǔ)設(shè)施、模型投入了大量資金，卻產(chǎn)出有限，算力使用率僅為15%，相當(dāng)于做了英偉達(dá)的囤貨商，又面臨著算力需求的急速壓縮。

DeepSeek崛起不僅是中國(guó)AI技術(shù)的重要突破，也是全球AI產(chǎn)業(yè)格局的重大變化。它帶來(lái)了成本的大幅下降，給傳統(tǒng)AI巨頭帶來(lái)了更大的競(jìng)爭(zhēng)壓力。我們并不驚訝看到，更少的計(jì)算就能實(shí)現(xiàn)相當(dāng)或更強(qiáng)大的功能，推理成本下降是人工智能改進(jìn)的標(biāo)志。據(jù)估計(jì)，算法的進(jìn)步速度為每年 4 倍，這意味著每過(guò)一年，實(shí)現(xiàn)相同功能所需的計(jì)算量就會(huì)減少 4 倍。Anthropic 首席執(zhí)行官 Dario 認(rèn)為，算法的進(jìn)步速度更快，可以帶來(lái)10 倍的改進(jìn)。例如，就 GPT-3推理定價(jià)而言，成本已下降了 1200 倍。需要明確的是，目前，DeepSeek 的獨(dú)特之處在于最優(yōu)化實(shí)現(xiàn)成本-功能水平，之前的 Mistral 和 Llama 型號(hào)階段性也做到了這一點(diǎn)。

正當(dāng) R1 被瘋狂炒作時(shí)，谷歌剛剛發(fā)布了一款更便宜的推理模型：Gemini Flash 2.0 Thinking。該模型比 R1 便宜得多，能夠通過(guò) API 為模型輸入更大的上下文長(zhǎng)度。根據(jù)報(bào)告的基準(zhǔn)測(cè)試，F(xiàn)lash 2.0 Thinking 擊敗了 R1，盡管基準(zhǔn)測(cè)試并不能說(shuō)明全部情況。Google 的模式很強(qiáng)大，在許多方面都與 R1 相媲美，但并沒(méi)有受到任何炒作。這可能是因?yàn)?Google 的市場(chǎng)策略乏善可陳，用戶體驗(yàn)不佳，且 R1 是來(lái)自中國(guó)的驚喜。

沒(méi)有誰(shuí)能夠在這場(chǎng)風(fēng)暴中獨(dú)善其身，不管是這次吳獎(jiǎng)的垂域模型構(gòu)建，或是DeepSeek的破局，再到谷歌Gemini Flash 2.0，都是讓AI不再神秘。當(dāng)開(kāi)源模型在GitHub上自由流動(dòng)，個(gè)人開(kāi)發(fā)者只關(guān)注基礎(chǔ)模型的性能和算力要求，用千元級(jí)顯卡就跑出企業(yè)級(jí)應(yīng)用，“技術(shù)平權(quán)”得到最貼切的詮釋。DeepSeek撕開(kāi)的這道裂縫，永遠(yuǎn)不會(huì)閉合，AI不再是少數(shù)人的權(quán)杖，而是照亮每個(gè)角落的光。

（責(zé)任編輯：康玲華）

??????????????????????????????????????????????????????運(yùn)營(yíng)商財(cái)經(jīng)（官方微信公眾號(hào)yyscjrd）—— 主流財(cái)經(jīng)網(wǎng)站，一家全面覆蓋科技、金融、證券、汽車(chē)、房產(chǎn)、食品、醫(yī)藥、日化、酒業(yè)及其他各種消費(fèi)品網(wǎng)站。