社区基准测试

开源模型排行榜

当今顶级开源AI模型的权威数据驱动排名。排序、比较并找到最适合你需求的模型。

排名 模型 MMLU 标签
1
Llama 3.1 8B
Meta
79.5
推理能力
2
Gemma 3n E4B
Google
74.5
效率之王 多模态
3
Phi-3 Medium
Microsoft
78.0
4
Qwen 2 7B
Alibaba
72.3
强大编程
5
Llama 3.2 3B
Meta
66.7
6
Gemma 3n E2B
Google
64.3
设备端 快速

* MMLU: 大规模多任务语言理解。GSM8K: 小学数学。HumanEval: 代码生成。

* 性能数据基于公开可用信息,可能因量化和实现而有所不同。

PWA已就绪