您现在的位置是：首页 > 生活常识 > 正文

生活常识

通义千问720亿参数模型宣布开源，部分性能超越闭源GPT-4

admin2023-12-01 13:59:13生活常识57

　　新浪科技讯12月1日午间消息，阿里云通义千问720亿参数模型Qwen-72B今日宣布开源。该模型基于3Ttokens高质量数据训练，在10个权威基准测评中夺得开源模型最优成绩，在部分测评中超越

　　新浪科技讯 12月1日午间消息，阿里云通义千问720亿参数模型Qwen-72B今日宣布开源。该模型基于3T tokens高质量数据训练，在10个权威基准测评中夺得开源模型最优成绩，在部分测评中超越闭源GPT-3.5和GPT-4。

　　在英语任务上，Qwen-72B在MMLU基准测试取得开源模型最高分；中文任务上，Qwen-72B在C-Eval、CMMLU、GaokaoBench等基准得分超越GPT-4；数学推理方面，Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型；代码理解方面，Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升，代码能力有了质的飞跃。

　　据介绍，Qwen-72B可以处理最多32k的长文本输入，在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。研发团队优化了Qwen-72B的指令遵循、工具使用等技能，使之能更好地被下游应用集成。比如，Qwen-72B搭载了强大的系统指令（System Prompt）能力，用户只用一句提示词就可定制AI助手，要求大模型扮演某个角色或者执行特定的回复任务。

　　随着Qwen-72B的开源，通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。至此，通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型，以及视觉理解、音频理解两款多模态大模型。（文猛）

发表评论

评论列表

这篇文章还没有收到评论，赶紧来抢沙发吧~

九洲商户网-商户处理平台

生活常识

通义千问720亿参数模型宣布开源，部分性能超越闭源GPT-4

拼多多三连阳再涨超4%，市值一举超过阿里，纳指100ETF（159660）半日跌0.56%，盘中溢价高阔升至0.3%！

重磅！国有资本运营公司进场买入ETF

相关文章

发表评论

评论列表