Median time to first token (s) — AI model leaderboard

AI models ranked by Median time to first token (s), an aggregated third-party benchmark from artificial_analysis. Lower is better. Cross-referenced against our first-party meo scores and Effective Value (𝕍).

Ranking 87 models across the full field · as of 2026-06-07.

#	Model	Lab	Median time to first token (s)
1	Z.ai: GLM 5 Turbo	z-ai	0
2	Z.ai: GLM 5V Turbo	z-ai	0
3	inclusionAI: Ling-2.6-1T	inclusionai	0
4	Google: Gemma 4 26B A4B (free)	google	0
5	inclusionAI: Ling-2.6-flash	inclusionai	0
6	Upstage: Solar Pro 3	upstage	0
7	OpenAI: o1-pro	openai	0
8	OpenAI: o1	openai	0
9	Prime Intellect: INTELLECT-3	prime-intellect	0
10	Google: Gemini 2.5 Flash Lite Preview 09-2025	google	0
11	Google: Gemma 3 27B	google	0
12	Google: Gemma 3 12B	google	0
13	OpenAI: GPT-3.5 Turbo (older v0613)	openai	0
14	OpenAI: GPT-5.4 Pro	openai	0
15	OpenAI: GPT-5.5 Pro	openai	0
16	Cohere: Command A	cohere	0.31
17	OpenAI: GPT-4.1 Nano	openai	0.39
18	OpenAI: gpt-oss-20b	openai	0.42
19	IBM: Granite 4.1 8B	ibm-granite	0.42
20	OpenAI: GPT-4o	openai	0.49
21	Google: Gemini 2.5 Flash	google	0.5
22	Microsoft: Phi 4	microsoft	0.5
23	OpenAI: gpt-oss-120b	openai	0.53
24	OpenAI: GPT-4.1 Mini	openai	0.57
25	OpenAI: GPT-4o (2024-05-13)	openai	0.57
26	OpenAI: GPT-4o-mini	openai	0.57
27	OpenAI: GPT-4.1	openai	0.61
28	Meta: Llama 4 Scout	meta-llama	0.62
29	Meta: Llama 4 Maverick	meta-llama	0.63
30	OpenAI: GPT-4o (2024-08-06)	openai	0.65
31	Mistral: Mistral Medium 3.5	mistralai	0.65
32	Arcee AI: Trinity Large Thinking	arcee-ai	0.77
33	Z.ai: GLM 5.1	z-ai	0.86
34	Qwen: Qwen3.5-9B	qwen	0.93
35	DeepSeek: DeepSeek V4 Flash	deepseek	0.95
36	Google: Gemini 3 Flash Preview	google	0.95
37	Google: Gemma 4 31B	google	1.02
38	OpenAI: GPT-4	openai	1.05
39	Kwaipilot: KAT-Coder-Pro V2	kwaipilot	1.07
40	Anthropic: Claude Sonnet 4.6	anthropic	1.08
41	DeepSeek: DeepSeek V4 Pro	deepseek	1.19
42	Qwen: Qwen3.5-122B-A10B	qwen	1.23
43	MiniMax: MiniMax M2.7	minimax	1.23
44	Qwen: Qwen3.6 35B A3B	qwen	1.24
45	Qwen: Qwen3 Coder Next	qwen	1.31
46	Qwen: Qwen3.7 Plus	qwen	1.32
47	StepFun: Step 3.7 Flash	stepfun	1.32
48	Xiaomi: MiMo-V2-Flash	xiaomi	1.37
49	Microsoft: Phi 4 Mini Instruct	microsoft	1.39
50	Qwen: Qwen3.6 27B	qwen	1.45
51	StepFun: Step 3.5 Flash	stepfun	1.5
52	OpenAI: GPT-4 Turbo	openai	1.68
53	Qwen: Qwen3.7 Max	qwen	1.72
54	Qwen: Qwen3.6 Plus	qwen	1.73
55	Qwen: Qwen3.5 397B A17B	qwen	1.9
56	inclusionAI: Ring-2.6-1T	inclusionai	1.91
57	MiniMax: MiniMax M3	minimax	2.38
58	Xiaomi: MiMo-V2.5-Pro	xiaomi	2.39
59	Tencent: Hy3 preview	tencent	2.53
60	OpenAI: GPT-5.2-Codex	openai	2.54
61	Inception: Mercury 2	inception	3.05
62	OpenAI: GPT-5.4 Nano	openai	3.31
63	OpenAI: GPT-5.1-Codex-Mini	openai	4.09
64	OpenAI: GPT-5 Codex	openai	4.59
65	OpenAI: GPT-5.1-Codex	openai	5.19
66	Google: Gemini 3.1 Flash Lite	google	5.26
67	OpenAI: o3 Mini	openai	5.71
68	OpenAI: o3	openai	5.81
69	OpenAI: GPT-5.4 Mini	openai	6.74
70	Reka Flash 3	rekaai	15
71	Google: Gemini 3.5 Flash	google	16
72	xAI: Grok 4.3	x-ai	17
73	Google: Gemini 2.5 Pro	google	19
74	OpenAI: o4 Mini	openai	20
75	OpenAI: o3 Mini High	openai	20
76	OpenAI: GPT-5.1	openai	21
77	Anthropic: Claude Opus 4.7	anthropic	24
78	Google: Gemini 3.1 Pro Preview	google	25
79	Anthropic: Claude Opus 4.8	anthropic	39
80	OpenAI: GPT-5.3-Codex	openai	59
81	OpenAI: GPT-5.5	openai	63
82	OpenAI: o3 Pro	openai	64
83	OpenAI: GPT-5 Mini	openai	83
84	OpenAI: GPT-5	openai	83
85	OpenAI: GPT-5 Nano	openai	88
86	OpenAI: GPT-5.2 Chat	openai	115
87	OpenAI: GPT-5.4	openai	178

Artificial Analysis (artificialanalysis.ai). Redistribution requires an AA commercial license.

← All rankings Methodology & 𝕍 →