腾讯一口气开源4款新模型,最小仅0.5B

   日期:2025-08-11     作者:4cb3h       评论:0    移动:http://mipe.zybear.com/mobile/news/268.html
核心提示:在AI世界里,庞大一直是力量的象征。但是——最近,腾讯工程师培育出一批端侧AI「新物种」,突破「大即强」的旧规律,以「小体型

在AI世界里,庞大一直是力量的象征。但是——


最近,腾讯工程师培育出一批端侧AI新物种,突破「大即强」的旧规律,以「小体型+超强记忆+高智慧」的姿态闯入人们的视野。


为更好地了解它们,我们启动了系统性的观测记录。经过多轮追踪与能力测试,我们记录下了这些「新物种」的特征——


图片


//体型小巧:最小仅0.5B,保留完整智能生态


目前,已经观测到4种不同规格的个体,分别是0.5B、1.8B、4B和7B。


与传统大模型的「缩小版」不同,它们在小体型中保留了完整的智能生态。在语言理解、数学、推理等多个公开评测中,它们的表现也不逊于一些大参数模型,得分达到了领先水平。


图片

*表格中,其它模型的评测指标均来自官方公布的评测结果


图片


//栖息地广泛:适配手机电脑等端侧设备


它们的栖息地十分广泛,消费级显卡即可运行,常见于各类端侧设备:手机、PC、平板、车载系统、智能家居等低功耗场景,都可能成为它们的活动场所。


比如,在车载系统中,它们可以结合实时地图与语音交互,为驾驶员提供路线规划与信息查询服务;在智能家居中,能与家电联动,执行用户的语音指令。


//适应力惊人:低内存、低算力流畅部署


在不同的环境条件下,这批AI「新物种都能保持稳定且高效的表现。它们能够依附在Arm、高通、Intel和联发科技等多种芯片平台上生存,并支持与SGLang、vLLM and TensorRT-LLM等主流推理框架无缝协作,并支持垂直领域低成本微调。


部署同样灵活——单卡即可完成部署,部分PC、手机、平板设备可直接接入使用;同时支持多种量化格式,在低算力或内存受限的情况下也能保持流畅响应。


超强的适应性,使它们几乎不挑环境,尤其适合边缘设备或资源有限的场景。


//双思考模式:快思考与慢思考自由切换


这些AI「新物种同时具备两种思维方式——


快思考模式下,能够迅速反应,适合即时反馈类任务;慢思考模式下,则会进行多步骤的深度推理与缜密分析,擅长处理复杂推演与战略决策。部署完成后,可以根据自己的业务场景需要,自由切换。


//超长记忆力:支持256k Tokens上下文


原生上下文窗口可达 256k Tokens,一次可消化约 40 万汉字或50万英文单词,相当于连续读完三本《哈利·波特》全卷,并准确保留故事脉络与人物关系。


这种超长记忆力让它们在持续对话和长任务执行中,能够始终保持上下文连贯与一致。


//技能丰富;具备完整的Agent能力


通过多维度高质量数据与强化学习奖励信号设计,这些AI「新物种」还具备任务规划、工具调用、复杂决策与反思等Agent能力,能够胜任深度信息检索、Excel自动化处理、旅行攻略设计等复杂任务。


比如,在市场调研任务中,它们会先根据目标制定调研提纲,再调用数据分析工具生成可视化图表,并基于结果输出执行建议。


图片


目前,这些AI「新物种」已经在腾讯会议、微信读书、腾讯手机管家、腾讯智能座舱、搜狗输入法、金融AI助手等多个内部业务场景中落地应用。


我们希望这批AI「新物种」的潜力,不只被我们看到,也能被更多人挖掘。为此,我们决定全面开源——


即日起,四款新模型在 GitHub 和 Hugging Face 上同步开源,可自由下载部署,并结合自己的业务环境,探索它们的能力边界。


当然,你也可以先到腾讯混元官方体验站,亲自试一试它们的实力,再决定是否将它们带回去「安家」。

官网体验地址:https://hunyuan.tencent.com/modelSquare/home/list


欢迎在评论区,分享你的第一手体验,等你。

 
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

举报收藏 0打赏 0评论 0
 
更多>同类最新资讯
0相关评论

相关文章
最新文章
推荐文章
推荐图文
最新资讯
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号