Live rankings

AI Model Leaderboard

Every major AI model ranked across benchmark quality, inference speed, agentic capability, programming aptitude, and cost efficiency — updated continuously from published evaluation data.

Explore full leaderboard Browse model catalog

334

Tracked models

Providers

286

Benchmarked

12.2

Avg. index

Overall Benchmarks Inference Agentic Programming Value / Price

Rank	Model	Provider	Score	Benchmarks	Inference	Agentic	Programming	Value	Price
1	Kimi K3 kimi-k3 multimodalvisionmulti-input reasoning	Moonshot AI	84.2 Agentic	76.1	84.8	84.2	0.0	12.2	$3 in / $15 out
2	Muse Spark 1.1 muse-spark-1.1 multimodalvisionmulti-input reasoning	Meta	76.6 Agentic	69.7	84.8	76.6	58.1	41.5	$1.25 in / $4.25 out
3	Seed 2.1 Pro seed-2.1-pro multimodalvisionmulti-input reasoning	ByteDance	75.6 Agentic	69.2	0.0	75.6	60.2	0.0	N/A
4	Claude Opus 4.8 claude-opus-4-8 multimodalvisionmulti-input reasoning	Anthropic	74.5 Agentic	74.4	28.3	74.5	81.3	8.0
5	GPT-5.6 Sol gpt-5.6-sol multimodalvisionmulti-input reasoning	OpenAI	71.4 Agentic	79.8	94.5	71.4	73.7	3.7	$5 in / $30 out
6	Claude Sonnet 4.5 claude-sonnet-4-5-20250929 multimodalvisionmulti-input reasoning	Anthropic	69.9 Agentic	51.4	12.6	69.9	74.6	12.0
7	GPT-5.5 Pro gpt-5.5-pro multimodalvisionmulti-input reasoning	OpenAI	69.2 Agentic	61.1	0.0	69.2	48.8	0.0	N/A
8	Claude Opus 4.1 claude-opus-4-1-20250805 multimodalvisionmulti-input reasoning	Anthropic	67.4 Agentic	46.0	0.0	67.4	60.8	0.0
9	Gemini 3.5 Flash gemini-3.5-flash multimodalvisionmulti-input reasoning	Google	67.3 Agentic	60.2	84.8	67.3	21.8	31.7
10	Claude Mythos Preview claude-mythos-preview multimodalvisionmulti-input reasoning	Anthropic	66.6 Agentic	80.0	0.0	66.6	82.7	0.0
11	Muse Spark muse-spark multimodalvisionmulti-input reasoning	Meta	64.4 Agentic	67.1	0.0	64.4	36.2	0.0	N/A
12	Seed 2.1 Turbo seed-2.1-turbo multimodalvisionmulti-input reasoning	ByteDance	63.1 Agentic	66.3	0.0	63.1	53.8	0.0	N/A
13	GPT-5.6 Terra gpt-5.6-terra multimodalvisionmulti-input reasoning	OpenAI	61.5 Agentic	74.6	94.5	61.5	69.6	17.1
14	GPT-5.5 gpt-5.5 multimodalvisionmulti-input reasoning	OpenAI	61.0 Agentic	76.7	94.5	61.0	51.2	3.7	$5 in / $30 out
15	Claude Sonnet 5 claude-sonnet-5 multimodalvisionmulti-input reasoning	Anthropic	60.7 Agentic	67.5	28.3	60.7	75.4	12.0
16	Gemini 3 Pro gemini-3-pro-preview multimodalvisionmulti-input reasoning	Google	58.0 Agentic	70.3	0.0	58.0	52.3	0.0
17	Claude Opus 4 claude-opus-4-20250514 multimodalvisionmulti-input reasoning	Anthropic	57.4 Agentic	35.8	0.0	57.4	47.0	0.0
18	Nova 2 Pro nova-2-pro multimodalvisionmulti-input reasoning	Amazon	57.2 Agentic	45.3	0.0	57.2	49.6	0.0	N/A
19	GPT-5.6 Luna gpt-5.6-luna multimodalvisionmulti-input reasoning	OpenAI	55.0 Agentic	63.9	94.5	55.0	65.5	37.8	$1 in / $6 out
20	Claude Opus 4.7 claude-opus-4-7 multimodalvisionmulti-input reasoning	Anthropic	54.2 Agentic	75.1	28.3	54.2	77.9	8.0

Rank

Model

Provider

Score

Price

Kimi K3

kimi-k3

multimodalvisionmulti-input reasoning

Moonshot AI

84.2

Agentic

$3 in / $15 out

Muse Spark 1.1

muse-spark-1.1

multimodalvisionmulti-input reasoning