AI Model Leaderboard — Skytells

Skytells

Rank	Model	Provider	Score	Benchmarks	Inference	Agentic	Programming	Value	Price
141	DeepSeek-V3.2-Speciale deepseek-v3.2-speciale codeprogrammingtool use	DeepSeek	33.3 overall	50.7	0.0	5.0	42.0	0.0	N/A
142	Llama 3.1 Nemotron Ultra 253B v1 llama-3.1-nemotron-ultra-253b-v1 textinference	NVIDIA	33.0 overall	33.0	0.0	0.0	0.0	0.0	N/A
143	Gemma 4 12B gemma-4-12b-it multimodalvisionmulti-input reasoning	Google	32.6 overall	32.6	0.0	0.0	0.0	0.0	N/A
144	Llama 4 Maverick llama-4-maverick multimodalvisionmulti-input reasoning	Meta	32.6 overall	32.6	0.0	0.0	0.0	0.0	N/A
145	MiniMax M2.7 minimax-m2.7 codeprogrammingtool use	MiniMax	32.1 overall	0.0	19.5	26.3	29.0	73.2	$0.3 in / $1.2 out
146	o1 o1-2024-12-17 multimodalvisionmulti-input reasoning	OpenAI	32.0 overall	41.9	0.0	44.7	5.6	0.0	N/A
147	Gemini 2.0 Flash gemini-2.0-flash multimodalvisionmulti-input reasoning	Google	31.7 overall	31.7	0.0	0.0	0.0	0.0
148	GPT-5.3 Codex gpt-5.3-codex texttext-to-textcoding	OpenAI	30.7 overall	0.0	31.1	0.0	34.5	22.0
149	GPT OSS 120B gpt-oss-120b textinference	OpenAI	30.5 overall	33.7	0.0	26.8	0.0	0.0	N/A
150	DeepSeek-V3 0324 deepseek-v3-0324 textinference	DeepSeek	30.4 overall	30.4	0.0	0.0	0.0	0.0	N/A
151	o3 o3-2025-04-16 multimodalvisionmulti-input reasoning	OpenAI	30.3 overall	42.9	0.0	17.9	27.7	0.0	N/A
152	Qwen3.6-35B-A3B qwen3.6-35b-a3b multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	30.0 overall	51.1	0.0	9.8	25.2	0.0	N/A
153	GPT-5.4 nano gpt-5.4-nano multimodalvisionmulti-input reasoning	OpenAI	30.0 overall	41.8	44.5	6.9	8.2	76.8	$0.2 in / $1.25 out
154	Gemini 2.5 Flash gemini-2.5-flash multimodalvisionmulti-input reasoning	Google	30.0 overall	38.2	0.0	0.0	19.5	0.0
155	Qwen3.5-4B qwen3.5-4b multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	29.9 overall	29.9	0.0	0.0	0.0	0.0	N/A
156	Qwen3 Max qwen3-max codeprogrammingtool use	Alibaba Cloud / Qwen Team	29.8 overall	28.0	0.0	0.0	32.1	0.0	N/A
157	Qwen3 VL 4B Instruct qwen3-vl-4b-instruct multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	29.7 overall	18.2	32.9	17.7	0.0	85.4
158	Ministral 3 (8B Reasoning 2512) ministral-8b-latest multimodalvisionmulti-input reasoning	Mistral AI	29.4 overall	29.4	0.0	0.0	0.0	0.0
159	Phi 4 Reasoning Plus phi-4-reasoning-plus textinference	Microsoft	29.4 overall	29.4	0.0	0.0	0.0	0.0	N/A
160	Qwen3 VL 4B Thinking qwen3-vl-4b-thinking multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	29.4 overall	20.2	32.9	17.0	0.0	79.3

141

DeepSeek-V3.2-Speciale

DeepSeek

33.3

N/A

142

Llama 3.1 Nemotron Ultra 253B v1

NVIDIA

33.0

N/A

143

Gemma 4 12B

Google

32.6

N/A

144

Page 8 of 17 · 334 models

Previous Next