ServiceNow 发布了 Apriel-v1.5-15B-Thinker,这是一个 15B 开放权重推理模型,领先于我们的“小模型”类别(<40B 参数) 💼 概述:Apriel-v1.5-15B-Thinker 是一个密集型的 15B 参数开放权重推理模型。这不是 ServiceNow 发布的第一个模型,但与过去的发布相比,智能水平有了显著提升。 🧠 智能:该模型在人工分析智能指数中得分 52。这使其与 DeepSeek R1 0528 相当,后者拥有更大的 685B 参数架构。ServiceNow 的模型在企业代理的重要行为方面得分特别高,例如指令遵循(在 IFBench 中得分 62%,领先于 gpt-oss-20B,推理)和多轮对话及工具使用(在 𝜏²-Bench Telecom 中得分 68%,领先于 gpt-oss-120B,推理)。这使其特别适合代理使用案例,这可能是考虑到 ServiceNow 在企业代理领域活跃的原因。 ⚙️ 输出令牌和冗长性:该模型即使在推理模型中也会产生大量输出令牌 - 使用约 110M 的推理和答案令牌来完成人工分析智能指数。 🖥️ 访问:目前没有无服务器推理提供商提供该模型,但它现在可以在 Hugging Face 上进行本地推理或自我部署。该模型已根据 MIT 许可证发布,支持无限制的商业使用。 ℹ️ 上下文窗口:该模型的原生上下文窗口为 128k 令牌。 祝贺 @ServiceNowRSRCH 取得这一令人印象深刻的成果!
Apriel-v1.5-15B-Thinker 是新的最智能开放权重小模型(<40B 参数)
个别基准测试结果。所有基准测试在各个模型之间进行了逐一比较,并且是独立运行的。
链接到 🤗 HuggingFace 仓库: 关于人工分析的进一步分析:
查看原文
4.22万
338
本页面内容由第三方提供。除非另有说明,欧易不是所引用文章的作者,也不对此类材料主张任何版权。该内容仅供参考,并不代表欧易观点,不作为任何形式的认可,也不应被视为投资建议或购买或出售数字资产的招揽。在使用生成式人工智能提供摘要或其他信息的情况下,此类人工智能生成的内容可能不准确或不一致。请阅读链接文章,了解更多详情和信息。欧易不对第三方网站上的内容负责。包含稳定币、NFTs 等在内的数字资产涉及较高程度的风险,其价值可能会产生较大波动。请根据自身财务状况,仔细考虑交易或持有数字资产是否适合您。