7月28日晚,清華系大模型明星企業(yè)智譜發(fā)布新一代旗艦?zāi)P虶LM-4.5,據(jù)悉,這一基礎(chǔ)模型專為智能體應(yīng)用打造,已在Hugging Face與ModelScope平臺同步開源。

技術(shù)人員介紹,GLM-4.5 參數(shù)量為 DeepSeek-R1的二分之一、Kimi-K2 的三分之一,但在多項標(biāo)準(zhǔn)基準(zhǔn)測試中表現(xiàn)得更好,得益于模型更高的參數(shù)效率。在性能優(yōu)化之外,GLM-4.5系列也在成本和效率上實(shí)現(xiàn)突破:API 調(diào)用價格低至輸入價格為0.8元/百萬tokens,輸出價格2元/百萬tokens,大幅低于目前主流的模型定價。

 “衡量AGI(通用人工智能)的第一性原理,是在不損失原有能力的前提下融合更多通用智能能力,GLM-4.5 是我們對此理念的首次完整呈現(xiàn),并有幸取得技術(shù)突破。”智譜相關(guān)負(fù)責(zé)人介紹,GLM-4.5 首次在單個模型中實(shí)現(xiàn)將推理、編碼和智能體能力原生融合,以滿足智能體應(yīng)用的復(fù)雜需求。

為綜合衡量模型的通用能力,技術(shù)團(tuán)隊選擇了最具有代表性的12個評測基準(zhǔn),綜合平均分,GLM-4.5 取得了全球模型第三、國產(chǎn)模型第一,開源模型第一。

真實(shí)場景表現(xiàn)比榜單更為重要。實(shí)測結(jié)果顯示,GLM-4.5 相對其他開源模型展現(xiàn)出競爭優(yōu)勢,特別在工具調(diào)用可靠性和任務(wù)完成度方面表現(xiàn)突出。

“編程和智能體能力以后就是大模型標(biāo)配了。”一位業(yè)內(nèi)人士表示。近來,編程能力正成為大模型的重要能力。然而過去,大模型編程也面臨著長程邏輯鏈斷裂、動態(tài)調(diào)試能力弱、交互與協(xié)作瓶頸等問題。智譜團(tuán)隊介紹,GLM-4.5擅長處理復(fù)雜代碼,能夠編寫復(fù)雜的應(yīng)用、游戲、交互網(wǎng)頁。根據(jù)演示,基于GLM-4.5 ,使用者只需給出“做一個 google搜索網(wǎng)站”“開發(fā)一個B站風(fēng)格的網(wǎng)頁端Demo”這樣的提示詞,就能快速生成一個真正能搜索的網(wǎng)站或一個能發(fā)彈幕的類B站網(wǎng)頁。“這主要得益于模型原生具備的在前端編寫網(wǎng)站、在后端進(jìn)行數(shù)據(jù)庫管理,以及通過工具調(diào)用接口支持任意智能體應(yīng)用的能力。”技術(shù)人員說。

據(jù)悉,GLM-4.5兼容Claude Code、Cline、Roo Code等主流代碼智能體,海內(nèi)外用戶可以在智譜開放平臺體驗(yàn)。

來源:北京日報客戶端

記者:孫奇茹

如遇作品內(nèi)容、版權(quán)等問題,請在相關(guān)文章刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系。版權(quán)侵權(quán)聯(lián)系電話:010-85202353