AI Model Leaderboard — Skytells

Skytells

Rank	Model	Provider	Score	Benchmarks	Inference	Agentic	Programming	Value	Price
121	Nemotron 3 Ultra (550B A55B) nemotron-3-ultra-550b-a55b codeprogrammingtool use	NVIDIA	36.5 overall	54.7	0.0	11.5	40.6	0.0	N/A
122	Gemini 2.5 Pro gemini-2.5-pro multimodalvisionmulti-input reasoning	Google	36.5 overall	42.5	51.0	0.0	21.4	29.8
123	Qwen3 VL 32B Thinking qwen3-vl-32b-thinking multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	36.5 overall	41.2	0.0	31.1	0.0	0.0
124	Qwen3-235B-A22B-Thinking-2507 qwen3-235b-a22b-thinking-2507 textinference	Alibaba Cloud / Qwen Team	36.3 overall	44.4	0.0	26.8	0.0	0.0	N/A
125	Nova 2 Lite nova-2-lite multimodalvisionmulti-input reasoning	Amazon	36.3 overall	41.1	62.8	13.0	26.0	59.1	$0.3 in / $2.5 out
126	Qwen3.5-9B qwen3.5-9b multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	36.3 overall	36.3	0.0	0.0	0.0	0.0	N/A
127	LongCat-Flash-Chat longcat-flash-chat codeprogrammingtool use	Meituan	36.3 overall	26.0	0.0	48.1	36.6	0.0	N/A
128	Nova 2 Omni nova-2-omni multimodalvisionmulti-input reasoning	Amazon	36.1 overall	36.1	0.0	0.0	0.0	0.0	N/A
129	Grok 4 Fast grok-4-fast multimodalvisionmulti-input reasoning	xAI	35.9 overall	55.7	0.0	12.8	0.0	0.0	N/A
130	Qwen3 VL 235B A22B Thinking qwen3-vl-235b-a22b-thinking multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	35.7 overall	35.2	0.0	36.2	0.0	0.0
131	DeepSeek-V3.2 (Thinking) deepseek-reasoner codeprogrammingtool use	DeepSeek	35.4 overall	49.8	0.0	12.4	42.0	0.0	N/A
132	Ministral 3 (14B Reasoning 2512) ministral-14b-latest multimodalvisionmulti-input reasoning	Mistral AI	35.4 overall	35.4	0.0	0.0	0.0	0.0
133	LongCat-Flash-Thinking longcat-flash-thinking codeprogrammingtool use	Meituan	35.1 overall	48.2	0.0	0.0	18.4	0.0
134	Kimi-k1.5 kimi-k1.5 multimodalvisionmulti-input reasoning	Moonshot AI	34.7 overall	34.7	0.0	0.0	0.0	0.0	N/A
135	Qwen3 30B A3B qwen3-30b-a3b textinference	Alibaba Cloud / Qwen Team	34.7 overall	23.7	26.6	0.0	0.0	78.5	$0.1 in / $0.44 out
136	GPT-4.1 gpt-4.1-2025-04-14 multimodalvisionmulti-input reasoning	OpenAI	34.5 overall	27.2	73.2	32.8	14.7	40.7
137	GLM-4.5 glm-4.5 codeprogrammingtool use	Zhipu AI	34.4 overall	31.5	0.0	36.0	36.1	0.0	N/A
138	GPT-4.1 nano gpt-4.1-nano-2025-04-14 multimodalvisionmulti-input reasoning	OpenAI	34.3 overall	11.6	87.8	0.0	0.0	94.9
139	GPT-5.4 Mini gpt-5.4-mini texttext-to-textlanguage	OpenAI	33.7 overall	51.1	44.5	15.0	20.0	42.7
140	Mistral Medium 3.5 mistral-medium-3-5 multimodalvisionmulti-input reasoning	Mistral AI	33.5 overall	34.6	23.2	15.4	59.0	34.8

121

Nemotron 3 Ultra (550B A55B)

NVIDIA

36.5

N/A

122

Gemini 2.5 Pro

Google

36.5

$1.25 in / $10 out

123

Qwen3 VL 32B Thinking

Alibaba Cloud / Qwen Team

36.5

N/A

124

Page 7 of 17 · 334 models

Previous Next