MMLU-Pro — AI model leaderboard

AI models ranked by MMLU-Pro, an aggregated third-party benchmark from artificial_analysis. Higher is better. Cross-referenced against our first-party meo scores and Effective Value (𝕍).

Ranking 37 models across the full field · as of 2026-06-07.

#	Model	Lab	MMLU-Pro
1	Google: Gemini 3 Flash Preview	google	88.2%
2	OpenAI: GPT-5.2 Chat	openai	87.4%
3	OpenAI: GPT-5	openai	87.1%
4	OpenAI: GPT-5.1	openai	87.0%
5	OpenAI: GPT-5 Codex	openai	86.5%
6	Google: Gemini 2.5 Pro	google	86.2%
7	OpenAI: GPT-5.1-Codex	openai	86.0%
8	OpenAI: o3	openai	85.3%
9	OpenAI: o1	openai	84.1%
10	OpenAI: GPT-5 Mini	openai	83.7%
11	OpenAI: o4 Mini	openai	83.2%
12	Prime Intellect: INTELLECT-3	prime-intellect	82.2%
13	OpenAI: GPT-5.1-Codex-Mini	openai	82.0%
14	Google: Gemini 2.5 Flash	google	80.9%
15	Meta: Llama 4 Maverick	meta-llama	80.9%
16	OpenAI: gpt-oss-120b	openai	80.8%
17	OpenAI: GPT-4.1	openai	80.6%
18	OpenAI: o3 Mini High	openai	80.2%
19	Google: Gemini 2.5 Flash Lite Preview 09-2025	google	79.6%
20	OpenAI: o3 Mini	openai	79.1%
21	OpenAI: GPT-4.1 Mini	openai	78.1%
22	OpenAI: GPT-5 Nano	openai	78.0%
23	Meta: Llama 4 Scout	meta-llama	75.2%
24	OpenAI: gpt-oss-20b	openai	74.8%
25	OpenAI: GPT-4o	openai	74.8%
26	Xiaomi: MiMo-V2-Flash	xiaomi	74.4%
27	OpenAI: GPT-4o (2024-05-13)	openai	74.0%
28	Microsoft: Phi 4	microsoft	71.4%
29	Cohere: Command A	cohere	71.2%
30	OpenAI: GPT-4 Turbo	openai	69.4%
31	Google: Gemma 3 27B	google	66.9%
32	Reka Flash 3	rekaai	66.9%
33	OpenAI: GPT-4.1 Nano	openai	65.7%
34	OpenAI: GPT-4o-mini	openai	64.8%
35	Google: Gemma 3 12B	google	59.5%
36	Microsoft: Phi 4 Mini Instruct	microsoft	46.5%
37	Google: Gemma 3 4B	google	41.7%

Artificial Analysis (artificialanalysis.ai). Redistribution requires an AA commercial license.

← All rankings Methodology & 𝕍 →