• 满不在乎网

    \u003cdiv class=\"rich_media_c

    腾讯混元开源“极小”模型,实际存储仅占�MB

    新京报贝壳财经讯(记者罗亦丹)2�日,腾讯混元开源面向消费级硬件场景的“极小”模型HY-1.8B-2Bit,该模型基𱆍.8B参数的小尺寸模型,通񙷈Bit量化技术,等效参数量约𰹄.3B,实际存储占用仅�MB,比常用的一些手机应用还小,实现了端侧部署的新突破。

    该模型基于混元团队首创的产业񏊈Bit端侧量化方案,通过对HY-1.8B-Instruct模型进񕋺比特量化感知训练(QAT)产出,模型大小减少至原始精度模型񊄩/6,同时在真实端侧设备上生成速度提𴃈-3倍,可大幅提升使用体验。能力上,模型还保留了原版的思维链,可以为不同复杂度的任务提供相应深度的推理过程。这是业界首个实񈓢bit产业级量化的端侧模型实践。

    随着大语言模型普及,如何将模型在手机、耳机或智能家居等设备上应用,成为业界难题,尤其是不少应用对模型的离线部署、私密性等都有更高的需求,这就需要更多能够在端侧运行的又小又强的模型。目前,模型已在开源模型社区Huggingface和Github上线。

    编辑 杨娟娟

    校对 柳宝庆

    访客,请您发表评论:

    网站分类
    热门文章
    友情链接