AI Model Leaderboard — Skytells

Skytells

Rank	Model	Provider	Score	Benchmarks	Inference	Agentic	Programming	Value	Price
41	GPT-5.1 Thinking gpt-5.1-thinking-2025-11-12 multimodalvisionmulti-input reasoning	OpenAI	51.4 Programming	62.4	0.0	0.0	51.4	0.0	N/A
42	GPT-5.5 gpt-5.5 multimodalvisionmulti-input reasoning	OpenAI	51.2 Programming	76.7	94.5	61.0	51.2	3.7	$5 in / $30 out
43	MiMo-V2-Omni mimo-v2-omni multimodalvisionmulti-input reasoning	Xiaomi	50.9 Programming	0.0	0.0	0.0	50.9	0.0	N/A
44	MiniMax M2.5 minimax-m2.5 codeprogrammingtool use	MiniMax	50.4 Programming	0.0	68.9	43.6	50.4	72.9	$0.3 in / $1.2 out
45	GPT-5.4 gpt-5.4 texttext-to-textlanguage	OpenAI	50.3 Programming	70.5	37.2	48.9	50.3	18.5
46	GPT-5 Codex gpt-5-codex-2025-09-15 codeprogrammingtool use	OpenAI	49.8 Programming	0.0	0.0	0.0	49.8	0.0	N/A
47	Nova 2 Pro nova-2-pro multimodalvisionmulti-input reasoning	Amazon	49.6 Programming	45.3	0.0	57.2	49.6	0.0	N/A
48	GPT-5.5 Pro gpt-5.5-pro multimodalvisionmulti-input reasoning	OpenAI	48.8 Programming	61.1	0.0	69.2	48.8	0.0	N/A
49	Step-3.5-Flash step-3.5-flash codeprogrammingtool use	StepFun	48.6 Programming	62.8	59.8	36.5	48.6	93.9	$0.1 in / $0.4 out
50	MiniMax M2.1 minimax-m2.1 codeprogrammingtool use	MiniMax	47.6 Programming	39.1	68.9	45.7	47.6	72.9	$0.3 in / $1.2 out
51	GLM-5.1 glm-5.1 codeprogrammingtool use	Zhipu AI	47.2 Programming	62.6	15.9	35.2	47.2	40.2	$1.4 in / $4.4 out
52	GPT-5.1 Codex gpt-5.1-codex multimodalvisionmulti-input reasoning	OpenAI	47.2 Programming	0.0	0.0	0.0	47.2	0.0
53	GPT-5 gpt-5-2025-08-07 multimodalvisionmulti-input reasoning	OpenAI	47.1 Programming	59.9	0.0	24.3	47.1	0.0
54	Claude Opus 4 claude-opus-4-20250514 multimodalvisionmulti-input reasoning	Anthropic	47.0 Programming	35.8	0.0	57.4	47.0	0.0
55	Seed 2.0 Lite seed-2.0-lite multimodalvisionmulti-input reasoning	ByteDance	46.1 Programming	56.5	0.0	0.0	46.1	0.0	N/A
56	GLM-4.6 glm-4.6 multimodalvisionmulti-input reasoning	Zhipu AI	43.2 Programming	44.5	0.0	35.4	43.2	0.0	N/A
57	Claude Sonnet 4 claude-sonnet-4-20250514 multimodalvisionmulti-input reasoning	Anthropic	42.8 Programming	39.3	0.0	49.4	42.8	0.0
58	GLM-4.7 glm-4.7 multimodalvisionmulti-input reasoning	Zhipu AI	42.5 Programming	60.3	0.0	26.6	42.5	0.0	N/A
59	DeepSeek-V3.2 (Thinking) deepseek-reasoner codeprogrammingtool use	DeepSeek	42.0 Programming	49.8	0.0	12.4	42.0	0.0
60	DeepSeek-V3.2 deepseek-v3.2 codeprogrammingtool use	DeepSeek	42.0 Programming	55.0	0.0	12.4	42.0	0.0	N/A

GPT-5.1 Thinking

OpenAI

51.4

N/A

GPT-5.5

OpenAI

51.2

$5 in / $30 out

MiMo-V2-Omni

Xiaomi

50.9

N/A

Page 3 of 17 · 334 models

Previous Next