TII推出Falcon Reasoning:全球顶尖70亿参数AI模型,性能超越更大规模模型

2026年01月12日 20:34:31  [来源:]  [作者:]  [责编:admin]
字体:【

Falcon H1R 7B将先进的推理能力融入紧凑型70亿参数模型,该模型针对速度和效率进行了优化
TII的最新AI模型在关键基准测试中超越了微软、阿里巴巴和英伟达等规模更大的竞争对手

阿拉伯联合酋长国阿布扎比--(美国商业资讯)--阿布扎比先进技术研究委员会(ATRC)下属的重要应用研究机构——科技创新研究所(TII)发布新一代AI模型Falcon H1R 7B。该模型以紧凑、高效且开源的形式提供世界一流的推理能力,显著提升了先进AI的普及度。

本新闻稿包含多媒体。此处查看新闻稿全文: https://www.businesswire.com/news/home/20260105086225/zh-CN/

Falcon H1R 7B仅有70亿个参数,却能够挑战并在多个方面超越全球更大型的开源AI模型,包括微软的Phi 4 Reasoning Plus 14B、阿里巴巴的Qwen3 32B以及英伟达的Nemotron H 47B。此次模型发布再次巩固了TII在高效AI创新领域的领先地位,并强化了阿联酋在全球技术领先国家中与日俱增的影响力。

阿联酋总统顾问兼ATRC秘书长Faisal al Bannai阁下表示:“Falcon H1R体现了阿联酋致力于构建开放、负责任的AI,为国家和全球创造真正价值的承诺。我们将世界一流的推理能力融入紧凑高效的模型,从而以一种推动经济增长、科研领导力和长期技术韧性的方式,扩大先进AI的普及范围。”

测试时推理的突破

Falcon H1R 7B在Falcon H1-7B的基础上,采用专门的训练方法和混合Transformer-Mamba架构,提高了准确性和速度。

“Falcon H1R 7B标志着紧凑型AI系统推理能力的飞跃。”TII首席执行官Najwa Aaraj博士表示,“它在顶级基准测试中取得了近乎完美的成绩,同时将内存和能耗控制在极低水平——这些正是现实部署和可持续发展的关键指标。”

这种方法释放了研究人员所谓的“潜在智能”,使Falcon H1R 7B能够更有效且高效地进行推理。该模型设定了一个新的帕累托边界,即性能的最佳平衡点,在这个平衡点上,速度的提升不会以牺牲质量为代价。

最佳基准测试

在竞争激烈的基准测试中,Falcon H1R 7B取得了卓越的成绩:

  • 数学:AIME-24测试得分达88.1%,超越了ServiceNow AI的Apriel 1.5 (15B) (86.2%)——这证明了紧凑型7B模型可与规模更大的系统相媲美,甚至超越。
  • 代码与代理任务:准确率达68.6%,在80亿参数以下模型中表现最佳,并在LCB v6、SciCode Sub和TB Hard基准测试中得分更高。Falcon H1R的得分为34%,高于中国的DeepSeek R1-0528 Qwen 3 8B (26.9%),甚至超过了Qwen3-32B (33.4%) 等更大规模的竞争者。
  • 通用推理:展现出强大的逻辑推理和指令执行能力,性能与微软Phi 4 Reasoning Plus (14B) 等规模更大的模型相当或接近,而参数量仅为后者的一半。
  • 效率:在批量64时,单GPU峰值性能达每秒1500个令牌,凭借混合Transformer-Mamba架构,其速度几乎达到中国Qwen3-8B的两倍——在保持准确性的同时,实现了更快的可扩展性能。

“该模型是世界一流研究和工程的成果,展现了科学的精确性与可扩展设计的完美结合。”TII人工智能与数字研究中心首席研究员Hakim Hacid博士表示,“我们很自豪能够推出这样一个模型,帮助社区构建更智能、更快速、更易用的AI系统。”

开源与社区驱动

秉承TII对AI透明度和协作的承诺,Falcon H1R 7B以开源模型形式发布,并采用Falcon TII许可证。全球的开发者、研究人员和机构可通过Hugging Face访问该模型,并获取完整的技术报告,其中详细介绍了训练策略和在关键推理基准测试中的表现。

此次新版本的发布建立在TII Falcon项目全球成功的基础之上。Falcon模型自问世以来,一直位列全球顶级AI系统之列,前四代在其各自类别中均取得了全球第一的排名。历经多次迭代升级之后,Falcon在性能、效率和实际部署能力方面均树立了新标杆,证明了紧凑型、自主运行的模型能够超越规模更大的系统。这一座座里程碑凸显了阿布扎比乃至整个阿联酋在前沿人工智能领域日益增强的领导地位,同时也印证了TII开展全球顶尖研究的能力。

*来源: AETOSWire

免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。

在 businesswire.com 上查看源版本新闻稿: https://www.businesswire.com/news/home/20260105086225/zh-CN/

CONTACT:

Jinan Warrayat
jinan.warrayat@tii.ae

TII推出Falcon Reasoning:全球顶尖70亿参数AI模型,性能超越更大规模模型 (图片:AETOSWire)

网易网友:总算我们也爱过
评论:连贝克汉姆都不知道,你丫还有什么资格敢跟我谈篮球

腾讯网友:清高 Demon,
评论:婚外情可以是个浪漫的故事,但离婚则是一次惨痛的事故。

本网网友:capital °故作
评论:闭上眼睛,我看到了我的前途

天涯网友:迷途不知歸返
评论:思想到行动距离,就像舌头到鼻子的距离一样,很近又很远

天猫网友:煙抽黑了心
评论:不是上午不想玩电脑,因为一起床就已经是中午了

凤凰网友:仅此°future
评论:世界上只有骗子是真心的,因为他是真心骗你的

搜狐网友:快樂始于釋懷
评论:这世界上最爱我的男人,早已经从了妈妈。

百度网友:A monologue. 独白。
评论:姐姐曾对我说:妹子你真好看!背面看,想犯罪;侧面看,想到退;正面看,想正当防卫。

淘宝网友:不了了之 Bulziゅ
评论:女人=吃饭+睡觉+花钱 女人=猪+花钱 女人-花钱=猪 结论:女人不花钱等于猪!

猫扑网友:挂念 - hcs/u3
评论:上联:该吃吃、该喝喝、有事别往心里搁。下联:泡泡澡、看看表、舒服一秒是一秒。横批:不能白活。

相关新闻
新闻焦点
公司2024年影响力报告展示了在可持续发展方面的重大进展和创新成果洛杉矶--(美国商业资讯)--拥有40年历史的领先消费电子品牌Belkin今日发布了其2024[更多]
First results from a Phase 3 trial conducted across 25 centers in Japan were presented at the Annual Meeting of the Japanese Urological As[更多]
文传商讯,中国领先的新闻稿来源,由国际文传(中国)电讯社携手美国商业资讯对外提供。帮助美国商业资讯将其客户的新闻稿呈现给大中华区的目标受众[更多]
关于我们 | 广告服务 | 浙江热线 | 旗龙网 | 听鱼网 | 2349 | 法律声明 | 联系我们
站务及信息报错:13757197494 (非诚勿扰) | QQ:1160322105 版权所有:上海经济新闻网 未经授权禁止复制或建立镜像
相关作品的原创性、文中陈述文字以及内容数据庞杂本站无法一一核实,如果您发现本网站上有侵犯您的合法权益的内容,请联系我们,本网站将立即予以删除!
中国互联网违法和不良信息举报中心  全国新闻记者证管理及核验网络系统  网络警察报警岗亭