【信報財經新聞】智譜(02513)宣布,面向部分企業客戶開放GLM-5.1高速版API(GLM-5.1-highspeed),模型輸出速度達每秒400 tokens,刷新全球大模型廠商API速度上限,且首次在國產大模型中實現旗艦級能力與極致低延遲的雙重突破。
今次發布的高速版打破行業「快即小」的固有認知,毋須為回應速度犧牲模型質量。高速版可實現「即問即答」,徹底改變傳統模型多輪調用耗時久的痛點。
實測數據顯示,高速版能力突出,代碼生成效率提升約10倍,可同步理解工程上下文並輸出方案;3D場景建模可實現文字輸入與場景即時聯動;還能即時生成匹配需求的工具與交互,具備新型作業系統雛形。
該API由智譜GLM團隊與TileRT團隊聯合打造,經推理引擎、調度系統、基礎設施三層優化。其核心突破在於TileRT引擎,通過編譯期靜態編排與Tile級微任務調度,消除冗餘開銷,逼近硬件物理極限。
目前,GLM-5.1高速版已適配AI編程、實時交互、商業決策、即時語音等高敏感場景,在智譜MaaS平台定向開放。未來智譜將持續優化推理引擎,擴大高速服務覆蓋,為企業提供低延遲、高智能的生產級AI能力,鞏固國產大模型在全球技術前沿的領先地位。