Live rankings

AI Model Leaderboard

Every major AI model ranked across benchmark quality, inference speed, agentic capability, programming aptitude, and cost efficiency — updated continuously from published evaluation data.

Explore full leaderboard Browse model catalog

334

Tracked models

Providers

286

Benchmarked

29.3

Avg. index

Overall Benchmarks Inference Agentic Programming Value / Price

Rank	Model	Provider	Score	Benchmarks	Inference	Agentic	Programming	Value	Price
1	Claude Mythos Preview claude-mythos-preview multimodalvisionmulti-input reasoning	Anthropic	76.5 overall	80.0	0.0	66.6	82.7	0.0	N/A
2	Kimi K3 kimi-k3 multimodalvisionmulti-input reasoning	Moonshot AI	72.2 overall	76.1	84.8	84.2	0.0	12.2
3	GPT-5.6 Sol gpt-5.6-sol multimodalvisionmulti-input reasoning	OpenAI	71.2 overall	79.8	94.5	71.4	73.7	3.7
4	Grok-4 Heavy grok-4-heavy multimodalvisionmulti-input reasoning	xAI	69.5 overall	69.5	0.0	0.0	0.0	0.0	N/A
5	Seed 2.1 Pro seed-2.1-pro multimodalvisionmulti-input reasoning	ByteDance	68.6 overall	69.2	0.0	75.6	60.2	0.0	N/A
6	Grok-4.1 Fast Non-Reasoning grok-4-1-fast-non-reasoning multimodalvisionmulti-input reasoning	xAI	68.5 overall	0.0	63.0	0.0	0.0	77.3
7	Grok-4.1 Fast Reasoning grok-4-1-fast-reasoning multimodalvisionmulti-input reasoning	xAI	68.5 overall	0.0	63.0	0.0	0.0	77.3
8	Grok-4 Fast Reasoning grok-4-fast-reasoning multimodalvisionmulti-input reasoning	xAI	68.5 overall	0.0	63.0	0.0	0.0	77.3
9	Muse Spark 1.1 muse-spark-1.1 multimodalvisionmulti-input reasoning	Meta	68.4 overall	69.7	84.8	76.6	58.1	41.5	$1.25 in / $4.25 out
10	GPT-5.6 Terra gpt-5.6-terra multimodalvisionmulti-input reasoning	OpenAI	67.8 overall	74.6	94.5	61.5	69.6	17.1
11	GPT-5.1 High gpt-5.1-high-2025-11-12 multimodalvisionmulti-input reasoning	OpenAI	67.1 overall	67.1	0.0	0.0	0.0	0.0
12	GPT-5.6 Luna gpt-5.6-luna multimodalvisionmulti-input reasoning	OpenAI	64.4 overall	63.9	94.5	55.0	65.5	37.8	$1 in / $6 out
13	DeepSeek-V3.2 (Non-thinking) deepseek-chat textinference	DeepSeek	63.8 overall	0.0	52.0	0.0	0.0	82.7	$0.28 in / $0.42 out
14	Claude Fable 5 claude-fable-5 multimodalvisionmulti-input reasoning	Anthropic	63.7 overall	70.8	62.8	0.0	84.2	0.0
15	GPT-5.5 gpt-5.5 multimodalvisionmulti-input reasoning	OpenAI	62.9 overall	76.7	94.5	61.0	51.2	3.7	$5 in / $30 out
16	Claude Opus 4.8 claude-opus-4-8 multimodalvisionmulti-input reasoning	Anthropic	61.9 overall	74.4	28.3	74.5	81.3	8.0
17	MiMo-V2-Pro mimo-v2-pro codeprogrammingtool use	Xiaomi	61.9 overall	0.0	0.0	0.0	61.9	0.0	N/A
18	GLM-5.2 glm-5.2 codeprogrammingtool use	Zhipu AI	61.7 overall	68.7	84.8	44.1	59.9	51.2	$0.95 in / $3 out
19	GPT-5 High gpt-5-high-2025-08-07 multimodalvisionmulti-input reasoning	OpenAI	61.6 overall	61.6	0.0	0.0	0.0	0.0
20	Seed 2.1 Turbo seed-2.1-turbo multimodalvisionmulti-input reasoning	ByteDance	61.5 overall	66.3	0.0	63.1	53.8	0.0	N/A

Rank

Model

Provider

Score

Price

Claude Mythos Preview

claude-mythos-preview

multimodalvisionmulti-input reasoning

Anthropic

76.5

overall

N/A

Kimi K3

kimi-k3

multimodalvisionmulti-input reasoning

Moonshot AI

72.2

overall

GPT-5.6 Sol

gpt-5.6-sol

multimodalvisionmulti-input reasoning

OpenAI

71.2

overall

Grok-4 Heavy

grok-4-heavy

multimodalvisionmulti-input reasoning

xAI

69.5

overall

N/A

Seed 2.1 Pro

seed-2.1-pro

multimodalvisionmulti-input reasoning

ByteDance

68.6

overall

N/A

Grok-4.1 Fast Non-Reasoning

grok-4-1-fast-non-reasoning

multimodalvisionmulti-input reasoning

xAI

68.5

overall

Grok-4.1 Fast Reasoning

grok-4-1-fast-reasoning

multimodalvisionmulti-input reasoning

xAI

68.5

overall

Grok-4 Fast Reasoning

grok-4-fast-reasoning

multimodalvisionmulti-input reasoning

xAI

68.5

overall

Muse Spark 1.1

muse-spark-1.1

multimodalvisionmulti-input reasoning