昆仑万维:天工大模型在权威推理榜单Benchmark GSM8K 测试中大幅领先GPT

10-25 汽车 投稿:管雅彤

【昆仑万维:天工大模型在权威推理榜单Benchmark GSM8K 测试中大幅领先GPT-3.5】!!!今天受到全网的关注度非常高,那么具体的是什么情况呢,下面大家可以一起来看看具体都是怎么回事吧!

1、昆仑万维在互动平台表示,天工AI助手的手机APP已开启内测。

2、日前,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评中,综合得分排名第一;在权威推理榜单Benchmark GSM8K 测试中,天工大模型以80%的正确率脱颖而出,大幅领先GPT-3.5(57.1%)和LLaMA2-70B(56.8%),推理能力达到全球领先水平;此外,在基于SuperCLUE综合性测评基准,包括多轮开放式问题测评SuperCLUE-OPEN和三大能力客观题测评SuperCLUE-OPT的测试中,天工大模型文理兼顾,跻身中文闭源模型第一梯队。

以上就是关于【昆仑万维:天工大模型在权威推理榜单Benchmark GSM8K 测试中大幅领先GPT-3.5】的相关消息了,希望对大家有所帮助!

声明:生活头条网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系admin@gdcyjd.com