更多精彩 >

趨境科技發(fā)布,首創(chuàng)“以存換算”和“全系統(tǒng)推理架構(gòu)”,助力企業(yè)高趨境科技

2024-10-12 16:02:54   來(lái)源:投資家網(wǎng)  作者: 

摘要:隨著大模型,尤其是開源大模型的持續(xù)進(jìn)化,具備復(fù)雜推理能力的模型正在逐步應(yīng)用于各行各業(yè),并展現(xiàn)出超越人類專家的潛力。

隨著大模型,尤其是開源大模型的持續(xù)進(jìn)化,具備復(fù)雜推理能力的模型正在逐步應(yīng)用于各行各業(yè),并展現(xiàn)出超越人類專家的潛力。得益于此,未來(lái)的算力建設(shè)將更加聚焦于推理場(chǎng)景,而不僅僅是訓(xùn)練算力。

華福證券的研究指出,到2027年,推理端的人工智能服務(wù)器預(yù)計(jì)將占整體工作負(fù)載的72.6%。同時(shí),OpenAI o1 所代表的大模型推理場(chǎng)景的 Scaling Law 也進(jìn)一步助推了這一趨勢(shì)的加速發(fā)展。

然而,盡管模型的效果有了顯著的提升,數(shù)百億參數(shù)、上百萬(wàn)上下文的一線模型在實(shí)際部署中仍面臨高成本和低效率的挑戰(zhàn)。這一現(xiàn)象導(dǎo)致了難以破解的“不可能三角”。

 

image.png

 

為了應(yīng)對(duì)這一困境,亟需新型推理架構(gòu),打破傳統(tǒng)主要為訓(xùn)練場(chǎng)景設(shè)計(jì),以高端 GPU 為中心的算力架構(gòu)設(shè)計(jì)思路。

在此背景下,趨境科技推出了“大模型知識(shí)推理一體機(jī)”,其搭載的業(yè)界首創(chuàng)的全系統(tǒng)推理架構(gòu)能夠通過(guò)協(xié)同存儲(chǔ)、CPU、GPU、NPU等多種設(shè)備,充分釋放異構(gòu)算力,將推理成本降低10倍以上。

 

image.png

 

這一創(chuàng)新為企業(yè)實(shí)現(xiàn)大模型的高效落地提供了全新選擇,開啟了通向“推理自由”的新途徑。

趨境大模型知識(shí)推理一體機(jī)不僅支持本地部署數(shù)百億級(jí)別的一線大模型,還提供開放的API接口,便于第三方靈活調(diào)用。同時(shí),用戶可根據(jù)需求定制企業(yè)智能助手(assistant/copilot),實(shí)現(xiàn)真正的“開箱即用”。

協(xié)同 HBM/DRAM/SSD 和 CPU/GPU/NPU 全系統(tǒng)異構(gòu)設(shè)備,充分釋放異構(gòu)存力和算力資源

與當(dāng)前行業(yè)主要針對(duì) GPU 算力利用率進(jìn)行單點(diǎn)優(yōu)化的傳統(tǒng)方案相比,趨境科技大模型知識(shí)推理一體機(jī)采用了業(yè)界首創(chuàng)的全系統(tǒng)推理架構(gòu)。

 

image.png

 

其通過(guò)“以存換算”技術(shù)釋放存力作為算力的補(bǔ)充,降低對(duì)算力的需求;同時(shí)采用“異構(gòu)協(xié)同”的思路,緊密聯(lián)動(dòng) HBM/DRAM/SSD 和 CPU/GPU/NPU 全系統(tǒng)異構(gòu)設(shè)備,突破顯存容量的限制,充分釋放全系統(tǒng)的存力和算力。

這一創(chuàng)新方案突破了以往方案的理論優(yōu)化極限,實(shí)現(xiàn)了整合機(jī)器所有異構(gòu)算力資源的目標(biāo),使得推理吞吐量提升超過(guò)10倍,大幅降低了大模型的落地成本。

此外,據(jù)財(cái)通證券發(fā)布的行業(yè)深度分析報(bào)告統(tǒng)計(jì)顯示,國(guó)產(chǎn)GPU產(chǎn)品在單精度/半精度浮點(diǎn)算力、制程及顯存容量上都與英偉達(dá)有2-4倍的顯著差距。因此,僅依靠GPU單點(diǎn)優(yōu)化,短時(shí)間內(nèi)很難趕超英偉達(dá)GPU方案。

而采用全系統(tǒng)推理架構(gòu)可以大幅降低GPU性能差距的影響,顯著提升國(guó)產(chǎn)替代解決方案的競(jìng)爭(zhēng)力,打破在大模型推理場(chǎng)景下國(guó)產(chǎn)GPU“卡脖子”的困境。

以存換算新范式,從“死記硬背”到“融合推理”

早期的大模型推理架構(gòu)將每次推理視為獨(dú)立請(qǐng)求,缺乏高效處理所需的“記憶”能力。盡管后續(xù)引入了近似問(wèn)題緩存(Semantic Query Cache)和前綴緩存(Prefix KVCache Cache),但仍主要依賴于“死記硬背”。這些方案要求新問(wèn)題與已處理問(wèn)題高度一致才能利用緩存去降低算力需求。

針對(duì)這一問(wèn)題,趨境科技創(chuàng)新性地設(shè)計(jì)了“融合推理(Fusion Attention)”技術(shù),即便是面對(duì)全新的問(wèn)題也可以從歷史相關(guān)信息中提取可復(fù)用的部分內(nèi)容,與現(xiàn)場(chǎng)信息進(jìn)行在線融合計(jì)算。這一技術(shù)顯著提升了可復(fù)用的歷史計(jì)算結(jié)果,進(jìn)而降低了計(jì)算量。

 

image.png

 

通過(guò)這一新思路,趨境大模型知識(shí)推理一體機(jī)充分利用了存儲(chǔ)資源。采用“以存換算”的方式釋放存力作為對(duì)于算力的補(bǔ)充,在RAG場(chǎng)景中,響應(yīng)延遲降低20倍,性能提升達(dá)10倍。

全系統(tǒng)異構(gòu)協(xié)同新架構(gòu),從GPU單點(diǎn)優(yōu)化到全系統(tǒng)協(xié)同優(yōu)化

除了通過(guò)“以存換算”降低算力需求外,趨境大模型知識(shí)推理一體機(jī)還進(jìn)一步通過(guò)全系統(tǒng)異構(gòu)協(xié)同架構(gòu)設(shè)計(jì),將來(lái)自存儲(chǔ)、CPU、GPU、NPU的算力高效融合,進(jìn)一步提升大模型推理性能,降低成本。

此前,趨境科技與清華 KVCache.AI 團(tuán)隊(duì)合作,開源了一部分異構(gòu)推理框架,項(xiàng)目名為“KTransformers”(GitHub鏈接:https://github.com/kvcache-ai/ktransformers),該開源框架僅需單個(gè)消費(fèi)級(jí) GPU 即可在本地運(yùn)行 Mixtral 8x22B 和DeepSeek-Coder-V2 等千億級(jí)大模型,性能數(shù)倍于 Llama.cpp。

在長(zhǎng)達(dá) 1M 的超長(zhǎng)上下文推理任務(wù)中,成為業(yè)界首個(gè)僅需單 GPU 卡的高性能推理框架,生成速度達(dá)到 16.91 token/s,比 Llama.cpp 快10倍以上,同時(shí)維持接近滿分的“大海撈針”能力。

 

image.png

 

趨境科技大模型知識(shí)推理一體機(jī)采用的全系統(tǒng)推理架構(gòu)是基于“KTransformers”進(jìn)一步完善的商業(yè)版本,在開源版的基礎(chǔ)上,協(xié)同性能更強(qiáng),加入了多卡高并發(fā)調(diào)度、RAG支持等策略。經(jīng)過(guò)測(cè)試及客戶合作驗(yàn)證,Prefill 和 Generate 性能大幅領(lǐng)先業(yè)界方案:

Prefill階段的 TTFT(響應(yīng)延遲)相比業(yè)界方案快6倍以上

Generate階段的 TPOT(生成速度)相比業(yè)界方案快3.48倍以上

趨境x長(zhǎng)亭:為安全大模型開啟千億大模型時(shí)代

國(guó)內(nèi)頂尖的網(wǎng)絡(luò)信息安全公司長(zhǎng)亭科技,使用趨境科技提供的全系統(tǒng)異構(gòu)推理架構(gòu)技術(shù)策略,無(wú)縫銜接到其原有的“問(wèn)津(ChaitinAI)安全大模型”、MSS 安全托管服務(wù)等產(chǎn)品中,問(wèn)津(ChaitinAI)安全大模型升級(jí)為千億大模型,安全性能全方位升級(jí):

核心指標(biāo)攻擊識(shí)別準(zhǔn)確率提升至95.8%,檢測(cè)時(shí)延降低至秒級(jí)。另外,其對(duì)漏洞的檢測(cè)能力增強(qiáng),不僅提升漏洞發(fā)現(xiàn)數(shù)量,對(duì)應(yīng)的修復(fù)建議也更準(zhǔn)確,還能基于不同場(chǎng)景選擇更合適的工具和策略。同時(shí),對(duì)不良內(nèi)容識(shí)別能力升級(jí),準(zhǔn)確率和召回率均有提升。安全報(bào)告內(nèi)容生成質(zhì)量和評(píng)分也顯著提高,綜合輸出更具健壯性和穩(wěn)定性。

此外,長(zhǎng)亭科技的安全大模型的部署資源成本降低50%,助推其更多業(yè)務(wù)加入大模型能力。

技術(shù)的不斷進(jìn)步和市場(chǎng)需求為大模型的未來(lái)發(fā)展提供了廣闊的空間。隨著算力基礎(chǔ)設(shè)施的不斷完善,提升算力的利用效率,使大模型能與更多的行業(yè)實(shí)踐結(jié)合起來(lái),未來(lái)大模型將在更多行業(yè)中發(fā)揮更大的作用。

趨境目前也正在和更多的大模型應(yīng)用廠商一同協(xié)作,希望助推全面智能化的到來(lái)。


猜你喜歡

大模型賦能智慧養(yǎng)老,百度智能云亮相2024金融街論壇年會(huì)

智能+百度智能云

近日,由北京市人民政府、中國(guó)人民銀行、國(guó)家金融監(jiān)督管理總局、中國(guó)證券監(jiān)督管理委員會(huì)、新華通訊社、國(guó)家...

7小時(shí)前

瓣鼎科技史明榮獲“元宇宙30人”賦能中國(guó)元宇宙創(chuàng)新人物獎(jiǎng)

智能+瓣鼎科技

10月18日-19日,由全國(guó)高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟、華算人工智能研究院主辦的“產(chǎn)學(xué)合作、協(xié)同育...

1天前

蘑菇車聯(lián)朱磊:車路云網(wǎng)絡(luò)解決大規(guī)模智能體安全、效率、博弈決策問(wèn)題

智能+蘑菇車聯(lián)

“當(dāng)前隨著AI、算力與數(shù)據(jù)的爆發(fā)式發(fā)展,全球最頂尖的科技公司都在聚焦一個(gè)核心問(wèn)題,就是實(shí)體世界的實(shí)時(shí)...

2024-10-15

再獲殊榮!閃回科技獲評(píng)中國(guó)移動(dòng)“踐行綠色低碳發(fā)展合作貢獻(xiàn)獎(jiǎng)”

智能+閃回科技

10月11日至13日,以“智煥新生,共創(chuàng)AI+時(shí)代”為主題的2024中國(guó)移動(dòng)全球合作伙伴大會(huì)在廣州隆...

2024-10-14

浩鯨科技重磅推出鯨智智能體開發(fā)平臺(tái),助推大模型應(yīng)用更快、更省、更簡(jiǎn)

智能+浩鯨科技

以大模型為“大腦”的 Al Agent(人工智能體)持續(xù)演進(jìn),有望逐步成為各行各業(yè)不可或缺的新型生產(chǎn)...

2024-10-12

常備宣肺敗毒顆粒,院士方劑對(duì)流感、新冠,肺炎衣原體感染等均有效

醫(yī)療健康步長(zhǎng)宣肺敗毒顆粒

后疫情時(shí)代,呼吸系統(tǒng)疾病的流行病學(xué)發(fā)生了很大的變化,不能再用過(guò)往的經(jīng)驗(yàn)去預(yù)測(cè)和應(yīng)對(duì),守護(hù)自己和家人的...

2024-08-21

易方智慧與四川天府新區(qū)改革創(chuàng)新研究院簽訂戰(zhàn)略合作協(xié)議

創(chuàng)新創(chuàng)業(yè)易方智慧

此次合作,旨在充分發(fā)揮雙方優(yōu)勢(shì),為新理念、新思想、新模式、新技術(shù)提供有力支持,助力黨委政府戰(zhàn)略咨詢、...

2024-08-21

華夏文化促進(jìn)會(huì)公布 “禮義華夏·百人名篇詩(shī)文作品展”入展名單

文化傳媒華夏文化促進(jìn)會(huì)

為喜迎新中國(guó) 75 周年華誕,同時(shí)更加有效助力中華優(yōu)秀傳統(tǒng)文化的創(chuàng)造性轉(zhuǎn)化和創(chuàng)新性發(fā)展,華夏文化促進(jìn)...

2024-08-21

鴻鵠實(shí)驗(yàn)室:TCL實(shí)業(yè)創(chuàng)新技術(shù)平臺(tái)“孵化器”

金融科技鴻鵠實(shí)驗(yàn)室

面向未來(lái),鴻鵠實(shí)驗(yàn)室將繼續(xù)以科技創(chuàng)新為驅(qū)動(dòng),以前瞻性思維引領(lǐng)TCL實(shí)業(yè)技術(shù)研發(fā)方向,不斷探索新產(chǎn)品、...

2024-08-21

禮義主題文壇盛宴 “禮義華夏 ·百人名篇詩(shī)文作品展”名單出爐

文化傳媒華夏文化促進(jìn)會(huì)

本次詩(shī)文展活動(dòng)以詩(shī)文形式詮釋、演繹、弘揚(yáng)了新時(shí)代禮義文化,是向新中國(guó)75周年華誕的一次重大獻(xiàn)禮,反映...

2024-08-21

TCL實(shí)業(yè)榮獲EISA2024-2025年度三項(xiàng)大獎(jiǎng)

TCL金融科技

今年是TCL出海的25周年。多年來(lái),TCL實(shí)業(yè)通過(guò)不斷提升科技創(chuàng)新能力,為全球消費(fèi)者提供了眾多讓人耳...

2024-08-21

呷哺呷哺迎來(lái)最強(qiáng)勁敵?小火鍋賽道跑出黑馬,年開直營(yíng)門店50家

大消費(fèi)一圍肥牛小火鍋

舊王衰落,新王當(dāng)立,小火鍋賽道正進(jìn)入重新洗牌期。

2024-08-21

廣州壹號(hào)譽(yù)品茶業(yè)有限公司獲得3300萬(wàn)元人民幣A輪融資

大消費(fèi)壹號(hào)譽(yù)品

此次融資的成功達(dá)成,不僅為壹號(hào)譽(yù)品茶業(yè)的未來(lái)發(fā)展注入了強(qiáng)勁的新動(dòng)力,更為中國(guó)茶行業(yè)的繁榮發(fā)展注入了新...

2024-08-21

中國(guó)最火基金經(jīng)理,讓人三觀盡毀

劉彥春一邊給基民巨虧,一邊拿著絕大多數(shù)人十輩子都無(wú)法企及的收入,堪稱中國(guó)最牛的“躺平家”。

2024-08-20

? 聚焦消費(fèi)新熱點(diǎn)、新趨勢(shì),第32屆深圳禮品家居展煥新登場(chǎng)

峰會(huì)“第32屆深圳禮品家居展”

2024年10月20-23日,第32屆中國(guó)(深圳)國(guó)際禮品及家居用品展覽會(huì)(以下簡(jiǎn)稱“第32屆深圳禮...

2024-08-20

投資家網(wǎng)(jubohaotong.com)是國(guó)內(nèi)領(lǐng)先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務(wù)平臺(tái)。為活躍于中國(guó)市場(chǎng)的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務(wù),包括行業(yè)媒體、智庫(kù)服務(wù)、會(huì)議服務(wù)及生態(tài)服務(wù)。長(zhǎng)按右側(cè)二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動(dòng),趕快行動(dòng)吧。

沙特天空塔投資設(shè)立專項(xiàng)基金帶領(lǐng)中國(guó)氫能獨(dú)角獸扎根沙特

2016年注冊(cè)于北京的中氫新能技術(shù)有限公司,下設(shè)位于大興的裝備制造公司、位于海淀區(qū)的技術(shù)研究院、材料...

挑戰(zhàn)奔馳的明星車企,突然“翻車”了

一度無(wú)比高光的理想汽車,猝不及防遭遇重挫。

深圳天使母基金姚小雄:將來(lái)股權(quán)投資行業(yè)競(jìng)爭(zhēng)是服務(wù)能力的競(jìng)爭(zhēng)

2024年1月10日,由投資家網(wǎng)主辦,財(cái)經(jīng)銳眼、有時(shí)間協(xié)辦,北京微金科技有限公司承辦的“第十二屆股權(quán)...

避免卡脖子,硬科技如何“逆境”突圍?

2024年1月10日,由投資家網(wǎng)主辦,財(cái)經(jīng)銳眼、有時(shí)間協(xié)辦,北京微金科技有限公司承辦的“第十二屆股權(quán)...

VC/PE眼中的“專精特新”

2024年1月10日,由投資家網(wǎng)主辦,財(cái)經(jīng)銳眼、有時(shí)間協(xié)辦,北京微金科技有限公司承辦的“第十二屆股權(quán)...

不響不輟|第18屆中國(guó)投資年會(huì)·年度峰會(huì)在滬召開

不響不輟|第18屆中國(guó)投資年會(huì)·年度峰會(huì)在滬召開

5月8-10日,由投中信息、投中網(wǎng)主辦的“第18屆中國(guó)投資年會(huì)·年度峰會(huì)”在上海外灘W酒店盛大召開。

2024汽車科技創(chuàng)新與成果轉(zhuǎn)化大會(huì)在常州成功召開

2024汽車科技創(chuàng)新與成果轉(zhuǎn)化大會(huì)在常州成功召開

4月12日,2024汽車科技創(chuàng)新與成果轉(zhuǎn)化大會(huì)在常州經(jīng)開區(qū)成功召開。

不響不輟 | 第18屆中國(guó)投資年會(huì)·年度峰會(huì)即將啟幕

不響不輟 | 第18屆中國(guó)投資年會(huì)·年度峰會(huì)即將啟幕

2024年5月8-10日,由投中信息、投中網(wǎng)主辦,以“不響不輟”為主題的第18屆中國(guó)投資年會(huì)·年度峰...

投資家網(wǎng)協(xié)辦:首屆深圳灣資本市場(chǎng)年會(huì)隆重舉行

投資家網(wǎng)協(xié)辦:首屆深圳灣資本市場(chǎng)年會(huì)隆重舉行

12月20日,由南山區(qū)資本市場(chǎng)協(xié)會(huì)主辦,投資家網(wǎng)、桐鵬匯財(cái)金高管俱樂(lè)部協(xié)辦的資本巿場(chǎng)年會(huì)隨即舉行。

“投資家網(wǎng)·2023中國(guó)價(jià)值企業(yè)榜”重磅發(fā)布

“投資家網(wǎng)·2023中國(guó)價(jià)值企業(yè)榜”重磅發(fā)布

身處百年未有之大變局,中國(guó)經(jīng)濟(jì)這艘萬(wàn)噸巨輪,早已屹立于世界舞臺(tái)中央。