AI Model Leaderboard — Skytells

Skytells

Rank	Model	Provider	Score	Benchmarks	Inference	Agentic	Programming	Value	Price
41	Claude Sonnet 4.6 claude-sonnet-4-6 multimodalvisionmulti-input reasoning	Anthropic	62.3 Benchmarks	62.3	12.6	41.0	65.6	12.0	$3 in / $15 out
42	GPT-5 High gpt-5-high-2025-08-07 multimodalvisionmulti-input reasoning	OpenAI	61.6 Benchmarks	61.6	0.0	0.0	0.0	0.0
43	GPT-5.5 Pro gpt-5.5-pro multimodalvisionmulti-input reasoning	OpenAI	61.1 Benchmarks	61.1	0.0	69.2	48.8	0.0	N/A
44	GPT-5.1 Codex High gpt-5.1-codex-high multimodalvisionmulti-input reasoning	OpenAI	61.0 Benchmarks	61.0	0.0	0.0	0.0	0.0
45	Qwen3.5-122B-A10B qwen3.5-122b-a10b multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	60.5 Benchmarks	60.5	0.0	44.6	38.3	0.0	N/A
46	GLM-4.7 glm-4.7 multimodalvisionmulti-input reasoning	Zhipu AI	60.3 Benchmarks	60.3	0.0	26.6	42.5	0.0	N/A
47	Gemini 3.5 Flash gemini-3.5-flash multimodalvisionmulti-input reasoning	Google	60.2 Benchmarks	60.2	84.8	67.3	21.8	31.7
48	MAI-Thinking-1 mai-thinking-1 codeprogrammingtool use	Microsoft	60.1 Benchmarks	60.1	0.0	0.0	32.2	0.0	N/A
49	GPT-5 gpt-5-2025-08-07 multimodalvisionmulti-input reasoning	OpenAI	59.9 Benchmarks	59.9	0.0	24.3	47.1	0.0	N/A
50	Grok-3 grok-3 multimodalvisionmulti-input reasoning	xAI	58.4 Benchmarks	58.4	50.2	0.0	0.0	24.1	$3 in / $15 out
51	Gemini 3.6 Flash gemini-3.6-flash multimodalvisionmulti-input reasoning	Google	57.8 Benchmarks	57.8	84.8	0.0	52.6	34.8
52	Qwen3.5-27B qwen3.5-27b multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	57.8 Benchmarks	57.8	32.9	41.3	39.1	61.0	$0.3 in / $2.4 out
53	ERNIE 5.0 ernie-5.0 multimodalvisionmulti-input reasoning	Baidu	56.8 Benchmarks	56.8	0.0	0.0	0.0	0.0	N/A
54	Seed 2.0 Lite seed-2.0-lite multimodalvisionmulti-input reasoning	ByteDance	56.5 Benchmarks	56.5	0.0	0.0	46.1	0.0	N/A
55	DeepSeek-V4-Flash-Max deepseek-v4-flash-max codeprogrammingtool use	DeepSeek	56.2 Benchmarks	56.2	84.8	35.3	41.4	98.8
56	Grok 4 Fast grok-4-fast multimodalvisionmulti-input reasoning	xAI	55.7 Benchmarks	55.7	0.0	12.8	0.0	0.0	N/A
57	Gemma 4 31B gemma-4-31b-it multimodalvisionmulti-input reasoning	Google	55.4 Benchmarks	55.4	32.9	0.0	0.0	91.5
58	DeepSeek-V3.2 deepseek-v3.2 codeprogrammingtool use	DeepSeek	55.0 Benchmarks	55.0	0.0	12.4	42.0	0.0	N/A
59	Nemotron 3 Ultra (550B A55B) nemotron-3-ultra-550b-a55b codeprogrammingtool use	NVIDIA	54.7 Benchmarks	54.7	0.0	11.5	40.6	0.0	N/A
60	Qwen3.6-27B qwen3.6-27b multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	54.7 Benchmarks	54.7	32.9	0.0	39.4	49.4	$0.6 in / $3.6 out

Claude Sonnet 4.6

Anthropic

62.3

$3 in / $15 out

GPT-5 High

OpenAI

61.6

N/A

GPT-5.5 Pro

OpenAI

61.1

N/A

Page 3 of 17 · 334 models

Previous Next