AI Model Leaderboard — Skytells

Skytells

Rank	Model	Provider	Score	Benchmarks	Inference	Agentic	Programming	Value	Price
61	Claude Opus 4.5 claude-opus-4-5-20251101 multimodalvisionmulti-input reasoning	Anthropic	35.2 Agentic	54.5	0.0	35.2	72.2	0.0	N/A
62	GLM-5.1 glm-5.1 codeprogrammingtool use	Zhipu AI	35.2 Agentic	62.6	15.9	35.2	47.2	40.2	$1.4 in / $4.4 out
63	GLM-5 glm-5 codeprogrammingtool use	Zhipu AI	35.1 Agentic	0.0	6.9	35.1	60.4	40.0	$1 in / $3.2 out
64	Qwen3.6 Plus qwen3.6-plus multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	33.6 Agentic	66.9	62.8	33.6	52.8	54.9	$0.5 in / $3 out
65	Gemini 3 Flash gemini-3-flash-preview multimodalvisionmulti-input reasoning	Google	33.2 Agentic	68.5	62.8	33.2	61.9	54.9
66	GPT-4.1 gpt-4.1-2025-04-14 multimodalvisionmulti-input reasoning	OpenAI	32.8 Agentic	27.2	73.2	32.8	14.7	40.7
67	Qwen3 VL 32B Thinking qwen3-vl-32b-thinking multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	31.1 Agentic	41.2	0.0	31.1	0.0	0.0
68	LongCat-Flash-Lite longcat-flash-lite codeprogrammingtool use	Meituan	30.1 Agentic	22.8	72.8	30.1	23.9	95.6	$0.1 in / $0.4 out
69	DeepSeek-V3.2-Exp deepseek-v3.2-exp codeprogrammingtool use	DeepSeek	27.2 Agentic	50.2	0.0	27.2	38.0	0.0	N/A
70	GPT OSS 120B gpt-oss-120b textinference	OpenAI	26.8 Agentic	33.7	0.0	26.8	0.0	0.0	N/A
71	MiniMax M1 40K minimax-m1-40k codeprogrammingtool use	MiniMax	26.8 Agentic	21.3	0.0	26.8	15.5	0.0	N/A
72	Qwen3-235B-A22B-Thinking-2507 qwen3-235b-a22b-thinking-2507 textinference	Alibaba Cloud / Qwen Team	26.8 Agentic	44.4	0.0	26.8	0.0	0.0	N/A
73	GLM-4.7 glm-4.7 multimodalvisionmulti-input reasoning	Zhipu AI	26.6 Agentic	60.3	0.0	26.6	42.5	0.0	N/A
74	MiniMax M2.7 minimax-m2.7 codeprogrammingtool use	MiniMax	26.3 Agentic	0.0	19.5	26.3	29.0	73.2	$0.3 in / $1.2 out
75	LongCat-Flash-Thinking-2601 longcat-flash-thinking-2601 codeprogrammingtool use	Meituan	25.6 Agentic	52.9	0.0	25.6	33.5	0.0
76	Qwen3 VL 32B Instruct qwen3-vl-32b-instruct multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	25.1 Agentic	26.5	0.0	25.1	0.0	0.0
77	Qwen3.5-397B-A17B qwen3.5-397b-a17b multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	24.7 Agentic	54.5	0.0	24.7	55.3	0.0	N/A
78	GPT-5 gpt-5-2025-08-07 multimodalvisionmulti-input reasoning	OpenAI	24.3 Agentic	59.9	0.0	24.3	47.1	0.0	N/A
79	GLM-4.5-Air glm-4.5-air codeprogrammingtool use	Zhipu AI	24.2 Agentic	25.7	0.0	24.2	16.0	0.0	N/A
80	Qwen3 VL 8B Instruct qwen3-vl-8b-instruct multimodalvisionmulti-input reasoning	Alibaba Cloud / Qwen Team	24.0 Agentic	8.0	0.0	24.0	0.0	0.0	N/A

Claude Opus 4.5

Anthropic

35.2

N/A

GLM-5.1

Zhipu AI

35.2

$1.4 in / $4.4 out

GLM-5

Zhipu AI

35.1

$1 in / $3.2 out

Page 4 of 17 · 334 models

Previous Next