AI Model Leaderboard — Skytells

Skytells

Rank	Model	Provider	Score	Benchmarks	Inference	Agentic	Programming	Value	Price
21	Gemini 3.1 Pro gemini-3.1-pro-preview multimodalvisionmulti-input reasoning	Google	60.9 Programming	72.3	58.3	52.6	60.9	22.7	$2.5 in / $15 out
22	Claude Opus 4.1 claude-opus-4-1-20250805 multimodalvisionmulti-input reasoning	Anthropic	60.8 Programming	46.0	0.0	67.4	60.8	0.0
23	GLM-5 glm-5 codeprogrammingtool use	Zhipu AI	60.4 Programming	0.0	6.9	35.1	60.4	40.0	$1 in / $3.2 out
24	Seed 2.1 Pro seed-2.1-pro multimodalvisionmulti-input reasoning	ByteDance	60.2 Programming	69.2	0.0	75.6	60.2	0.0	N/A
25	GLM-5.2 glm-5.2 codeprogrammingtool use	Zhipu AI	59.9 Programming	68.7	84.8	44.1	59.9	51.2	$0.95 in / $3 out
26	Hy3 hy3 codeprogrammingtool use	Tencent	59.2 Programming	65.9	0.0	40.4	59.2	0.0	N/A
27	Mistral Medium 3.5 mistral-medium-3-5 multimodalvisionmulti-input reasoning	Mistral AI	59.0 Programming	34.6	23.2	15.4	59.0	34.8
28	Muse Spark 1.1 muse-spark-1.1 multimodalvisionmulti-input reasoning	Meta	58.1 Programming	69.7	84.8	76.6	58.1	41.5	$1.25 in / $4.25 out
29	Kimi K2-Thinking-0905 kimi-k2-thinking-0905 codeprogrammingtool use	Moonshot AI	58.0 Programming	66.2	0.0	50.8	58.0	0.0
30	MiMo-V2.5-Pro mimo-v2.5-pro codeprogrammingtool use	Xiaomi	56.3 Programming	36.2	84.8	0.0	56.3	78.0	$0.435 in / $0.87 out
31	Seed 2.0 Pro seed-2.0-pro multimodalvisionmulti-input reasoning	ByteDance	56.0 Programming	66.8	23.2	44.8	56.0	54.9	$0.5 in / $3 out
32	Qwen3.5-397B-A17B qwen3.5-397b-a17b multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	55.3 Programming	54.5	0.0	24.7	55.3	0.0	N/A
33	Claude Haiku 4.5 claude-haiku-4-5-20251001 multimodalvisionmulti-input reasoning	Anthropic	53.9 Programming	30.8	53.3	50.8	53.9	45.6
34	Seed 2.1 Turbo seed-2.1-turbo multimodalvisionmulti-input reasoning	ByteDance	53.8 Programming	66.3	0.0	63.1	53.8	0.0	N/A
35	Qwen3.6 Plus qwen3.6-plus multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	52.8 Programming	66.9	62.8	33.6	52.8	54.9	$0.5 in / $3 out
36	Gemini 3.6 Flash gemini-3.6-flash multimodalvisionmulti-input reasoning	Google	52.6 Programming	57.8	84.8	0.0	52.6	34.8
37	Gemini 3 Pro gemini-3-pro-preview multimodalvisionmulti-input reasoning	Google	52.3 Programming	70.3	0.0	58.0	52.3	0.0
38	DeepSeek-V4-Pro-Max deepseek-v4-pro-max codeprogrammingtool use	DeepSeek	52.0 Programming	64.9	84.8	51.0	52.0	45.1
39	GPT-5.1 gpt-5.1-2025-11-13 multimodalvisionmulti-input reasoning	OpenAI	51.4 Programming	62.4	62.8	0.0	51.4	37.3
40	GPT-5.1 Instant gpt-5.1-instant-2025-11-12 multimodalvisionmulti-input reasoning	OpenAI	51.4 Programming	62.4	62.8	0.0	51.4	37.3

Gemini 3.1 Pro

Google

60.9

$2.5 in / $15 out

Claude Opus 4.1

Anthropic

60.8

N/A

GLM-5

Zhipu AI

60.4

$1 in / $3.2 out

Page 2 of 17 · 334 models

Previous Next