AI Model Leaderboard — Skytells

Skytells

Rank	Model	Provider	Score	Benchmarks	Agentic	Programming	Price
261	GPT-4o mini gpt-4o-mini-2024-07-18 multimodalvisionmulti-input reasoning	OpenAI	8.0 overall	14.2	0.0	0.0	N/A
262	Phi-4-multimodal-instruct phi-4-multimodal-instruct multimodalvisionmulti-input reasoning	Microsoft	8.0 overall	8.0	0.0	0.0	N/A
263	Pixtral-12B pixtral-12b-2409 multimodalvisionmulti-input reasoning	Mistral AI	8.0 overall	8.0	0.0	0.0
264	Gemma 3 27B gemma-3-27b-it multimodalvisionmulti-input reasoning	Google	7.6 overall	7.6	0.0	0.0	N/A
265	Jamba 1.5 Large jamba-1.5-large textinference	AI21 Labs	7.5 overall	7.5	0.0	0.0	N/A
266	Phi-3.5-MoE-instruct phi-3.5-moe-instruct multimodalvisionmulti-input reasoning	Microsoft	7.5 overall	7.5	0.0	0.0	N/A
267	Qwen2.5-Omni-7B qwen2.5-omni-7b multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	7.2 overall	7.2	0.0	0.0	N/A
268	DeepSeek VL2 deepseek-vl2 multimodalvisionmulti-input reasoning	DeepSeek	6.8 overall	6.8	0.0	0.0	N/A
269	Qwen2.5 7B Instruct qwen-2.5-7b-instruct textinference	Alibaba Cloud / Qwen Team	6.8 overall	6.8	0.0	0.0	N/A
270	Qwen2-VL-72B-Instruct qwen2-vl-72b multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	6.8 overall	6.8	0.0	0.0	N/A
271	Claude 3.5 Haiku claude-3-5-haiku-20241022 codeprogrammingtool use	Anthropic	6.7 overall	9.9	3.0	6.6
272	GPT-4 gpt-4-0613 multimodalvisionmulti-input reasoning	OpenAI	6.2 overall	6.2	0.0	0.0	N/A
273	Mistral Small 3 24B Base mistral-small-24b-base-2501 multimodalvisionmulti-input reasoning	Mistral AI	5.9 overall	5.9	0.0	0.0
274	DeepSeek R1 Distill Qwen 1.5B deepseek-r1-distill-qwen-1.5b textinference	DeepSeek	5.6 overall	5.6	0.0	0.0	N/A
275	Claude 3 Haiku claude-3-haiku-20240307 multimodalvisionmulti-input reasoning	Anthropic	5.3 overall	5.3	0.0	0.0
276	Qwen2.5 VL 7B Instruct qwen2.5-vl-7b multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	4.9 overall	9.0	0.0	0.0	N/A
277	Llama 3.2 3B Instruct llama-3.2-3b-instruct textinference	Meta	4.8 overall	4.8	0.0	0.0	N/A
278	DeepSeek VL2 Small deepseek-vl2-small multimodalvisionmulti-input reasoning	DeepSeek	4.6 overall	4.6	0.0	0.0
279	Gemini Diffusion gemini-diffusion codeprogrammingtool use	Google	4.3 overall	6.5	0.0	1.5	N/A
280	Gemma 3 4B gemma-3-4b-it multimodalvisionmulti-input reasoning	Google	4.3 overall	4.3	0.0	0.0	N/A

261

GPT-4o mini

OpenAI

8.0

N/A

262

Phi-4-multimodal-instruct

Microsoft

8.0

N/A

263

Pixtral-12B

Mistral AI

8.0

N/A

264

Page 14 of 17 · 334 models

Previous Next