腾讯一口气开源4款新模型，最小仅0.5B

日期：2025-08-11 作者：4cb3h 评论：0 移动：http://mipe.zybear.com/mobile/news/268.html

核心提示：在AI世界里，庞大一直是力量的象征。但是——最近，腾讯工程师培育出一批端侧AI「新物种」，突破「大即强」的旧规律，以「小体型

在AI世界里，庞大一直是力量的象征。但是——

最近，腾讯工程师培育出一批端侧AI「新物种」，突破「大即强」的旧规律，以「小体型+超强记忆+高智慧」的姿态闯入人们的视野。

为更好地了解它们，我们启动了系统性的观测记录。经过多轮追踪与能力测试，我们记录下了这些「新物种」的特征——

//体型小巧：最小仅0.5B，保留完整智能生态

目前，已经观测到4种不同规格的个体，分别是0.5B、1.8B、4B和7B。

与传统大模型的「缩小版」不同，它们在小体型中保留了完整的智能生态。在语言理解、数学、推理等多个公开评测中，它们的表现也不逊于一些大参数模型，得分达到了领先水平。

*表格中，其它模型的评测指标均来自官方公布的评测结果

//栖息地广泛：适配手机电脑等端侧设备

它们的栖息地十分广泛，消费级显卡即可运行，常见于各类端侧设备：手机、PC、平板、车载系统、智能家居等低功耗场景，都可能成为它们的活动场所。

比如，在车载系统中，它们可以结合实时地图与语音交互，为驾驶员提供路线规划与信息查询服务；在智能家居中，能与家电联动，执行用户的语音指令。

//适应力惊人：低内存、低算力流畅部署

在不同的环境条件下，这批AI「新物种」都能保持稳定且高效的表现。它们能够依附在Arm、高通、Intel和联发科技等多种芯片平台上生存，并支持与SGLang、vLLM and TensorRT-LLM等主流推理框架无缝协作，并支持垂直领域低成本微调。

部署同样灵活——单卡即可完成部署，部分PC、手机、平板设备可直接接入使用；同时支持多种量化格式，在低算力或内存受限的情况下也能保持流畅响应。

超强的适应性，使它们几乎不挑环境，尤其适合边缘设备或资源有限的场景。

//双思考模式：快思考与慢思考自由切换

这些AI「新物种」同时具备两种思维方式——

快思考模式下，能够迅速反应，适合即时反馈类任务；慢思考模式下，则会进行多步骤的深度推理与缜密分析，擅长处理复杂推演与战略决策。部署完成后，可以根据自己的业务场景需要，自由切换。

//超长记忆力：支持256k Tokens上下文

原生上下文窗口可达 256k Tokens，一次可消化约 40 万汉字或50万英文单词，相当于连续读完三本《哈利·波特》全卷，并准确保留故事脉络与人物关系。

这种超长记忆力让它们在持续对话和长任务执行中，能够始终保持上下文连贯与一致。

//技能丰富；具备完整的Agent能力

通过多维度高质量数据与强化学习奖励信号设计，这些AI「新物种」还具备任务规划、工具调用、复杂决策与反思等Agent能力，能够胜任深度信息检索、Excel自动化处理、旅行攻略设计等复杂任务。

比如，在市场调研任务中，它们会先根据目标制定调研提纲，再调用数据分析工具生成可视化图表，并基于结果输出执行建议。

目前，这些AI「新物种」已经在腾讯会议、微信读书、腾讯手机管家、腾讯智能座舱、搜狗输入法、金融AI助手等多个内部业务场景中落地应用。

我们希望这批AI「新物种」的潜力，不只被我们看到，也能被更多人挖掘。为此，我们决定全面开源——

即日起，四款新模型在 GitHub 和 Hugging Face 上同步开源，可自由下载部署，并结合自己的业务环境，探索它们的能力边界。

当然，你也可以先到腾讯混元官方体验站，亲自试一试它们的实力，再决定是否将它们带回去「安家」。

官网体验地址：https://hunyuan.tencent.com/modelSquare/home/list

欢迎在评论区，分享你的第一手体验，等你。

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

点赞 0举报收藏 0打赏 0评论 0

更多>同类最新资讯

0 条相关评论

相关文章

最新文章

推荐文章

推荐图文

大局已定，房地产该如	迅速落实苏州市重大产
央视官宣！年代大剧《	新学期新起点新梦想

最新资讯

点击排行