【信報財經新聞】騰訊(00700)旗下騰訊混元在微信指出,為了進一步滿足推理系統對動態業務負載的適應性、核心模組對複雜精度和高性能融合算子的需求,HPC-Ops推出全新更新開源升級,包含五大關鍵算子。
騰訊混元稱,本次升級在主流推理平台上,有效緩解了Attention長尾延遲、顯存搬運開銷、跨卡通訊等實際工程瓶頸,多項性能指標顯著優於現有的開源基線。
HPC-Ops是騰訊混元AI Infra團隊開源,並長期維護的一套工業級、高性能的大模型推理底層算子庫。
【信報財經新聞】騰訊(00700)旗下騰訊混元在微信指出,為了進一步滿足推理系統對動態業務負載的適應性、核心模組對複雜精度和高性能融合算子的需求,HPC-Ops推出全新更新開源升級,包含五大關鍵算子。
騰訊混元稱,本次升級在主流推理平台上,有效緩解了Attention長尾延遲、顯存搬運開銷、跨卡通訊等實際工程瓶頸,多項性能指標顯著優於現有的開源基線。
HPC-Ops是騰訊混元AI Infra團隊開源,並長期維護的一套工業級、高性能的大模型推理底層算子庫。