2026-02-22 08:52
查看更多
Sarvam 两款新模子中的较小型号采用 30B-A1B 设想,印度 AI 尝试室 Sarvam 本地时间本月 18 日正在印度人工智能影响力峰会上发布了 2 款“从 0 建立”的最新一代 MoE 架构狂言语模子。预锻炼数据集规模达 16T,其“大大都基准测试中优于 DeepSeek R1,API 拜候和仪表盘支撑也将随后推出。支撑 32K 上下文窗口,
IT之家 2 月 20 日动静,前往搜狐,
福建j9国际集团官网信息技术有限公司
Copyright©2021 All Rights Reserved 版权所有 网站地图