Live rankings

AI Model Leaderboard

Every major AI model ranked across benchmark quality, inference speed, agentic capability, programming aptitude, and cost efficiency — updated continuously from published evaluation data.

Explore full leaderboard Browse model catalog

334

Tracked models

Providers

286

Benchmarked

15.1

Avg. index

Overall Benchmarks Inference Agentic Programming Value / Price

Rank	Model	Provider	Score	Benchmarks	Inference	Agentic	Programming	Value	Price
1	Claude Fable 5 claude-fable-5 multimodalvisionmulti-input reasoning	Anthropic	84.2 Programming	70.8	62.8	0.0	84.2	0.0	$10 in / $50 out
2	Claude Mythos Preview claude-mythos-preview multimodalvisionmulti-input reasoning	Anthropic	82.7 Programming	80.0	0.0	66.6	82.7	0.0
3	Claude Opus 4.8 claude-opus-4-8 multimodalvisionmulti-input reasoning	Anthropic	81.3 Programming	74.4	28.3	74.5	81.3	8.0
4	Claude Opus 4.7 claude-opus-4-7 multimodalvisionmulti-input reasoning	Anthropic	77.9 Programming	75.1	28.3	54.2	77.9	8.0
5	Claude Sonnet 5 claude-sonnet-5 multimodalvisionmulti-input reasoning	Anthropic	75.4 Programming	67.5	28.3	60.7	75.4	12.0
6	Claude Sonnet 4.5 claude-sonnet-4-5-20250929 multimodalvisionmulti-input reasoning	Anthropic	74.6 Programming	51.4	12.6	69.9	74.6	12.0
7	Qwen3.7 Max qwen3.7-max multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	74.2 Programming	64.7	62.8	49.6	74.2	43.9	$1.25 in / $3.75 out
8	GPT-5.6 Sol gpt-5.6-sol multimodalvisionmulti-input reasoning	OpenAI	73.7 Programming	79.8	94.5	71.4	73.7	3.7	$5 in / $30 out
9	Claude Opus 4.5 claude-opus-4-5-20251101 multimodalvisionmulti-input reasoning	Anthropic	72.2 Programming	54.5	0.0	35.2	72.2	0.0
10	Claude Opus 4.6 claude-opus-4-6 multimodalvisionmulti-input reasoning	Anthropic	71.5 Programming	74.6	28.3	49.8	71.5	8.0
11	Grok 4.5 grok-4.5 multimodalvisionmulti-input reasoning	xAI	70.8 Programming	69.3	38.2	0.0	70.8	35.6	$2 in / $6 out
12	GPT-5.6 Terra gpt-5.6-terra multimodalvisionmulti-input reasoning	OpenAI	69.6 Programming	74.6	94.5	61.5	69.6	17.1
13	Kimi K2.6 kimi-k2.6 texttext-to-textlanguage	Moonshot AI	69.4 Programming	63.5	32.9	47.2	69.4	46.3
14	MiniMax M3 minimax-m3 multimodalvisionmulti-input reasoning	MiniMax	68.3 Programming	49.6	62.8	37.5	68.3	73.2	$0.3 in / $1.2 out
15	GPT-5.2 gpt-5.2-2025-12-11 multimodalvisionmulti-input reasoning	OpenAI	66.3 Programming	70.9	62.8	37.0	66.3	31.5
16	Claude Sonnet 4.6 claude-sonnet-4-6 multimodalvisionmulti-input reasoning	Anthropic	65.6 Programming	62.3	12.6	41.0	65.6	12.0
17	GPT-5.6 Luna gpt-5.6-luna multimodalvisionmulti-input reasoning	OpenAI	65.5 Programming	63.9	94.5	55.0	65.5	37.8
18	Gemini 3 Flash gemini-3-flash-preview multimodalvisionmulti-input reasoning	Google	61.9 Programming	68.5	62.8	33.2	61.9	54.9
19	MiMo-V2-Pro mimo-v2-pro codeprogrammingtool use	Xiaomi	61.9 Programming	0.0	0.0	0.0	61.9	0.0	N/A
20	Qwen3.7-Plus qwen3.7-plus multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	61.1 Programming	62.9	62.8	48.1	61.1	69.5	$0.32 in / $1.28 out

Rank

Model

Provider

Score

Price

Claude Fable 5

claude-fable-5

multimodalvisionmulti-input reasoning

Anthropic

84.2

Programming

$10 in / $50 out

Claude Mythos Preview

claude-mythos-preview

multimodalvisionmulti-input reasoning

Anthropic

82.7

Programming

Claude Opus 4.8

claude-opus-4-8

multimodalvisionmulti-input reasoning

Anthropic

81.3

Programming

Claude Opus 4.7

claude-opus-4-7

multimodalvisionmulti-input reasoning

Anthropic

77.9

Programming

Claude Sonnet 5

claude-sonnet-5

multimodalvisionmulti-input reasoning

Anthropic

75.4

Programming

Claude Sonnet 4.5

claude-sonnet-4-5-20250929

multimodalvisionmulti-input reasoning

Anthropic

74.6

Programming

Qwen3.7 Max

qwen3.7-max

multimodalvisionmulti-input reasoning

Alibaba Cloud / Qwen Team

74.2

Programming

$1.25 in / $3.75 out

GPT-5.6 Sol

gpt-5.6-sol

multimodalvisionmulti-input reasoning

OpenAI

73.7

Programming

$5 in / $30 out

Claude Opus 4.5

claude-opus-4-5-20251101

multimodalvisionmulti-input reasoning

Anthropic

72.2

Programming

Claude Opus 4.6

claude-opus-4-6

multimodalvisionmulti-input reasoning

Anthropic

71.5

Programming

Grok 4.5

grok-4.5

multimodalvisionmulti-input reasoning

xAI

70.8

Programming

$2 in / $6 out

GPT-5.6 Terra

gpt-5.6-terra

multimodalvisionmulti-input reasoning

OpenAI

69.6

Programming

Kimi K2.6

kimi-k2.6

texttext-to-textlanguage

Moonshot AI

69.4

Programming

MiniMax M3

minimax-m3

multimodalvisionmulti-input reasoning

MiniMax

68.3

Programming

$0.3 in / $1.2 out

GPT-5.2

gpt-5.2-2025-12-11

multimodalvisionmulti-input reasoning

OpenAI

66.3

Programming

Claude Sonnet 4.6

claude-sonnet-4-6

multimodalvisionmulti-input reasoning

Anthropic

65.6

Programming

GPT-5.6 Luna

gpt-5.6-luna

multimodalvisionmulti-input reasoning

OpenAI

65.5

Programming

Gemini 3 Flash

gemini-3-flash-preview

multimodalvisionmulti-input reasoning

Google

61.9

Programming

MiMo-V2-Pro

mimo-v2-pro

codeprogrammingtool use

Xiaomi

61.9

Programming

N/A

Qwen3.7-Plus

qwen3.7-plus

multimodalvisionmulti-input reasoning

Alibaba Cloud / Qwen Team

61.1

Programming

$0.32 in / $1.28 out