我的股票

    名稱 現價 升跌

    資料報價延遲十五分鐘

    國產大模型丨騰訊混元推0.3B端側模型

    【中國】 信報財經新聞 16小時前

    【信報財經新聞】【騰訊/國產大模型/騰訊混元】騰訊(00700)旗下騰訊混元宣布,基於首個產業級2位元(bit)端側量化方案,正式推出一款面向消費級硬件場景的「極小」模型HY-1.8B-2Bit,等效參數量僅有0.3B,記憶體佔用僅600MB,較常用的一些手機應用程式還小。

    據介紹,通過對此前混元的小尺寸語言模型—HY-1.8B-Instruct進行2位元量化感知訓練(QAT)產出,這一模型對比原始精度模型等效參數量降低6倍,並且在沿用原模型全思考能力同時,在真實端側設備上對比原始精度模型生成速度提升2至3倍,可大幅提升使用體驗。

    今次騰訊混元推出HY-1.8B-2Bit模型,可以在邊緣設備上無壓力部署。這也是首個在實現2位元產業級量化的端側模型實踐。

    目前,市場憧憬陸續有國產大模型發布更新版本,早前有傳智譜(02513)和稀宇科技(00100)於春節前發布大模型更新,阿里(09988)旗下的Qwen3.5亦傳出將於春節期間出爐。中銀國際證券指出,今年大模型迎來春節檔,豆包2.0、Seedance 2.0、Qwen3.5等內地龍頭廠商大模型,有望在春節前後將密集更新,AI應用或迎來觸底反彈。

    想睇更多財經消息