即是李飞飞团队之功,亦是通义千问模型之能。从技术实现来看,s1模型基于阿里云通义千问(Qwen)模型进行监督微调。研究团队构建了包含1000个样本的s1K数据集,这些样本经精心筛选,涵盖50个不同领域,具备高质量、多样化和高难度特点

添加新评论