Median output throughput (tokens/s) — AI model leaderboard

AI models ranked by Median output throughput (tokens/s), an aggregated third-party benchmark from artificial_analysis. Higher is better. Cross-referenced against our first-party meo scores and Effective Value (𝕍).

Ranking 87 models across the full field · as of 2026-06-07.

#	Model	Lab	Median output throughput (tokens/s)
1	Inception: Mercury 2	inception	1,075
2	OpenAI: gpt-oss-120b	openai	358
3	Google: Gemini 3.1 Flash Lite	google	317
4	OpenAI: gpt-oss-20b	openai	268
5	Arcee AI: Trinity Large Thinking	arcee-ai	226
6	Google: Gemini 3.5 Flash	google	222
7	OpenAI: o3 Mini High	openai	219
8	OpenAI: GPT-5.1-Codex-Mini	openai	219
9	xAI: Grok 4.3	x-ai	212
10	Google: Gemini 2.5 Flash	google	197
11	OpenAI: GPT-5 Codex	openai	195
12	StepFun: Step 3.5 Flash	stepfun	193
13	Google: Gemini 3 Flash Preview	google	188
14	OpenAI: o3 Mini	openai	187
15	OpenAI: GPT-5 Nano	openai	179
16	OpenAI: GPT-4.1 Nano	openai	176
17	OpenAI: o4 Mini	openai	173
18	OpenAI: GPT-5.4 Mini	openai	173
19	OpenAI: GPT-5.1-Codex	openai	172
20	Qwen: Qwen3.6 35B A3B	qwen	169
21	OpenAI: GPT-5.4 Nano	openai	159
22	OpenAI: o3	openai	157
23	OpenAI: GPT-4o	openai	156
24	StepFun: Step 3.7 Flash	stepfun	148
25	OpenAI: GPT-5.1	openai	142
26	OpenAI: GPT-4o (2024-08-06)	openai	140
27	Google: Gemini 2.5 Pro	google	139
28	Qwen: Qwen3.5-122B-A10B	qwen	138
29	OpenAI: GPT-5.2-Codex	openai	136
30	OpenAI: GPT-4o (2024-05-13)	openai	136
31	Google: Gemini 3.1 Pro Preview	google	133
32	IBM: Granite 4.1 8B	ibm-granite	132
33	Xiaomi: MiMo-V2-Flash	xiaomi	129
34	OpenAI: GPT-4.1	openai	127
35	inclusionAI: Ring-2.6-1T	inclusionai	124
36	Kwaipilot: KAT-Coder-Pro V2	kwaipilot	115
37	Meta: Llama 4 Scout	meta-llama	113
38	Meta: Llama 4 Maverick	meta-llama	109
39	DeepSeek: DeepSeek V4 Flash	deepseek	108
40	Qwen: Qwen3 Coder Next	qwen	106
41	Qwen: Qwen3.7 Max	qwen	105
42	OpenAI: GPT-4.1 Mini	openai	105
43	OpenAI: GPT-5 Mini	openai	101
44	OpenAI: GPT-5	openai	97
45	Tencent: Hy3 preview	tencent	96
46	OpenAI: GPT-5.3-Codex	openai	95
47	Reka Flash 3	rekaai	93
48	OpenAI: GPT-5.4	openai	92
49	Qwen: Qwen3.5-9B	qwen	92
50	OpenAI: GPT-5.2 Chat	openai	75
51	Z.ai: GLM 5.1	z-ai	75
52	OpenAI: GPT-4o-mini	openai	73
53	Cohere: Command A	cohere	71
54	Anthropic: Claude Opus 4.8	anthropic	71
55	MiniMax: MiniMax M2.7	minimax	68
56	Mistral: Mistral Medium 3.5	mistralai	66
57	Qwen: Qwen3.6 27B	qwen	64
58	Anthropic: Claude Opus 4.7	anthropic	62
59	OpenAI: GPT-5.5	openai	61
60	DeepSeek: DeepSeek V4 Pro	deepseek	61
61	Anthropic: Claude Sonnet 4.6	anthropic	60
62	Qwen: Qwen3.6 Plus	qwen	53
63	Qwen: Qwen3.7 Plus	qwen	52
64	Qwen: Qwen3.5 397B A17B	qwen	52
65	Xiaomi: MiMo-V2.5-Pro	xiaomi	46
66	MiniMax: MiniMax M3	minimax	45
67	OpenAI: GPT-4	openai	39
68	Microsoft: Phi 4	microsoft	39
69	Google: Gemma 4 31B	google	35
70	OpenAI: GPT-4 Turbo	openai	33
71	OpenAI: o3 Pro	openai	33
72	Microsoft: Phi 4 Mini Instruct	microsoft	24
73	Z.ai: GLM 5 Turbo	z-ai	0
74	Z.ai: GLM 5V Turbo	z-ai	0
75	inclusionAI: Ling-2.6-1T	inclusionai	0
76	Google: Gemma 4 26B A4B (free)	google	0
77	inclusionAI: Ling-2.6-flash	inclusionai	0
78	Upstage: Solar Pro 3	upstage	0
79	OpenAI: o1-pro	openai	0
80	Prime Intellect: INTELLECT-3	prime-intellect	0
81	Google: Gemini 2.5 Flash Lite Preview 09-2025	google	0
82	Google: Gemma 3 27B	google	0
83	Google: Gemma 3 12B	google	0
84	OpenAI: GPT-5.4 Pro	openai	0
85	OpenAI: GPT-5.5 Pro	openai	0
86	OpenAI: o1	openai	0
87	OpenAI: GPT-3.5 Turbo (older v0613)	openai	0

Artificial Analysis (artificialanalysis.ai). Redistribution requires an AA commercial license.

← All rankings Methodology & 𝕍 →