IFBench — AI model leaderboard

AI models ranked by IFBench, an aggregated third-party benchmark from artificial_analysis. Higher is better. Cross-referenced against our first-party meo scores and Effective Value (𝕍).

Ranking 79 models across the full field · as of 2026-06-07.

#	Model	Lab	IFBench
1	MiniMax: MiniMax M3	minimax	82.9%
2	xAI: Grok 4.3	x-ai	81.3%
3	Qwen: Qwen3.7 Max	qwen	80.5%
4	Xiaomi: MiMo-V2.5-Pro	xiaomi	79.9%
5	DeepSeek: DeepSeek V4 Flash	deepseek	79.2%
6	Qwen: Qwen3.5 397B A17B	qwen	78.8%
7	Qwen: Qwen3.7 Plus	qwen	78.0%
8	OpenAI: GPT-5.2-Codex	openai	77.6%
9	Google: Gemini 3.1 Flash Lite	google	77.2%
10	Google: Gemini 3.1 Pro Preview	google	77.1%
11	DeepSeek: DeepSeek V4 Pro	deepseek	76.5%
12	Google: Gemini 3.5 Flash	google	76.3%
13	Z.ai: GLM 5.1	z-ai	76.3%
14	OpenAI: GPT-5.4 Nano	openai	75.9%
15	OpenAI: GPT-5.5	openai	75.9%
16	MiniMax: MiniMax M2.7	minimax	75.7%
17	Qwen: Qwen3.5-122B-A10B	qwen	75.7%
18	Google: Gemma 4 31B	google	75.6%
19	OpenAI: GPT-5.2 Chat	openai	75.4%
20	OpenAI: GPT-5 Mini	openai	75.4%
21	OpenAI: GPT-5.3-Codex	openai	75.4%
22	Qwen: Qwen3.6 Plus	qwen	75.2%
23	OpenAI: GPT-5 Codex	openai	74.1%
24	OpenAI: GPT-5.4	openai	73.9%
25	OpenAI: GPT-5.4 Mini	openai	73.3%
26	Z.ai: GLM 5 Turbo	z-ai	73.2%
27	OpenAI: GPT-5	openai	73.1%
28	OpenAI: GPT-5.1	openai	72.9%
29	Google: Gemma 4 26B A4B (free)	google	72.4%
30	OpenAI: o3	openai	71.4%
31	Upstage: Solar Pro 3	upstage	71.2%
32	OpenAI: o1	openai	70.3%
33	OpenAI: GPT-5.1-Codex	openai	70.0%
34	Inception: Mercury 2	inception	69.8%
35	OpenAI: gpt-oss-120b	openai	69.0%
36	Mistral: Mistral Medium 3.5	mistralai	68.8%
37	OpenAI: o4 Mini	openai	68.7%
38	OpenAI: GPT-5.1-Codex-Mini	openai	67.9%
39	Qwen: Qwen3.6 27B	qwen	67.6%
40	OpenAI: GPT-5 Nano	openai	67.6%
41	StepFun: Step 3.7 Flash	stepfun	67.3%
42	OpenAI: o3 Mini High	openai	67.1%
43	Qwen: Qwen3.5-9B	qwen	66.7%
44	Kwaipilot: KAT-Coder-Pro V2	kwaipilot	66.7%
45	StepFun: Step 3.5 Flash	stepfun	66.5%
46	OpenAI: gpt-oss-20b	openai	65.1%
47	Qwen: Qwen3.6 35B A3B	qwen	64.4%
48	Tencent: Hy3 preview	tencent	63.1%
49	Anthropic: Claude Opus 4.8	anthropic	62.2%
50	Z.ai: GLM 5V Turbo	z-ai	61.1%
51	Anthropic: Claude Opus 4.7	anthropic	58.6%
52	inclusionAI: Ling-2.6-flash	inclusionai	57.4%
53	inclusionAI: Ling-2.6-1T	inclusionai	56.9%
54	Arcee AI: Trinity Large Thinking	arcee-ai	56.3%
55	Google: Gemini 3 Flash Preview	google	55.1%
56	Google: Gemini 2.5 Pro	google	48.7%
57	inclusionAI: Ring-2.6-1T	inclusionai	44.6%
58	OpenAI: GPT-4.1	openai	43.0%
59	Meta: Llama 4 Maverick	meta-llama	43.0%
60	Google: Gemini 2.5 Flash Lite Preview 09-2025	google	41.8%
61	Anthropic: Claude Sonnet 4.6	anthropic	41.2%
62	Xiaomi: MiMo-V2-Flash	xiaomi	39.9%
63	Meta: Llama 4 Scout	meta-llama	39.5%
64	Google: Gemini 2.5 Flash	google	39.0%
65	IBM: Granite 4.1 8B	ibm-granite	38.6%
66	OpenAI: GPT-4.1 Mini	openai	38.3%
67	Google: Gemma 3 12B	google	36.7%
68	Cohere: Command A	cohere	36.5%
69	OpenAI: GPT-4o (2024-08-06)	openai	36.0%
70	Qwen: Qwen3 Coder Next	qwen	35.2%
71	OpenAI: GPT-4o	openai	34.3%
72	Prime Intellect: INTELLECT-3	prime-intellect	34.0%
73	OpenAI: GPT-4.1 Nano	openai	32.0%
74	Google: Gemma 3 27B	google	31.8%
75	OpenAI: GPT-4o-mini	openai	31.0%
76	Reka Flash 3	rekaai	30.4%
77	Google: Gemma 3 4B	google	28.3%
78	Microsoft: Phi 4	microsoft	23.5%
79	Microsoft: Phi 4 Mini Instruct	microsoft	21.1%

Artificial Analysis (artificialanalysis.ai). Redistribution requires an AA commercial license.

← All rankings Methodology & 𝕍 →