开源AI模型挑战闭源里程碑?Meta Llama 31-405B多项跑分超越OpenAI GPT-4o
股市逐梦者
2024-11-24 00:10:50
0

这标志着开源模型可能首次击败目前最先进的闭源LLM模型。

IT之家 7 月 23 日消息,网友在 LocalLLaMA 子 Reddit 板块中发帖,分享了 4050 亿参数的 Meta Llama 3.1 信息,从该 AI 模型在几个关键 AI 基准测试的结果来看,其性能超越目前的领先者(OpenAI 的 GPT-4o)。

这是开源人工智能社区的一个重要里程碑,标志着开源模型可能首次击败目前最先进的闭源 LLM 模型。

开源AI模型挑战闭源里程碑?Meta Llama 3.1-405B多项跑分超越OpenAI GPT-4o

如基准测试所示,Meta Llama 3.1 在 GSM8K、Hellaswag、boolq、MMLU-humanities、MMLU-other、MMLU-stem 和 winograd 等多项测试中均优于 GPT-4o,但是,它在 HumanEval 和 MMLU-social sciences 方面却落后于 GPT-4o。

值得注意的是,这些数据来自 Llama 3.1 的基本模型,意味着后续通过调整优化,可以进一步释放该模型的潜力,在上述基准测试中迈上更高的台阶。

IT之家注:上图为机翻字幕,存在错误

相关内容

开源AI模型挑战闭源里程碑...
这标志着开源模型可能首次击败目前最先进的闭源LLM模型。IT之家 ...
2024-11-24 00:10:50
股票配额:投资者获得新股的...
title===>股票配额:投资者获得新股的权利[field]bo...
2024-11-23 00:09:32
广州再迎国漫盛会,中国国际...
日前,国内唯一“国字号”漫画节展中国国际漫画节,宣布第十七届活动的...
2024-10-28 23:02:04

热门资讯

除夕当天开放签证互免 OTA平...   1月25日,《中华人民共和国政府与新加坡共和国政府关于互免持普通护照人员签证协定》正式签署,该协...
广州获得全球首批“灯塔城市”称... 夏长、潮湿又多雨 一道广州人“解”了千年的“生活命题” 在没有风扇没有空调的古代 聪明的老广 ...
新能源汽车在中国“爆火”,在海... 在中国,政府对新能源汽车的大力扶持不仅反映在财政补贴上。新能源汽车在中国的爆炸性增长与海外市场的温和...
乡村运营学临安,究竟学什么? 临安作为乡村运营策源地,受到全国各地的关注。自2017年开始,浙江省杭州市临安区率先探索乡村运营模式...
美股异动|Robinhood涨... “网红券商”Robinhood(HOOD.US)涨7.54%,报18.45美元。消息面上,Robin...
一人带三个儿童坐不了飞机?多家... 近日,有网友在社交平台反映,一个成人带三个儿童坐不了飞机。OTA平台显示,“航司规定,每名乘机人最多...
浪潮信息成交额达100亿元   浪潮信息成交额达100亿元,现涨3.72%。
三朝元老石智勇挺举三次试举均失... 北京时间8月9日凌晨,在巴黎奥运会举重男子73公斤级决赛中,尽管在抓举中取得较大的优势,但由于在挺举...
2023个税年度汇算政策发布!... 国家税务总局日前发布《关于办理2023年度个人所得税综合所得汇算清缴事项的公告 》(国家税务总局公告...
历史趣味诗词② 大明湖畔的夏... 夏天的美,在于荷。 一枝红艳,擎于碧波之上, 出淤泥而不染,濯清涟而不妖。 娉娉婷婷,袅袅娜娜...