qwen3-235b-a22b-instruct-2507 vs grok-4.20-beta-0309-reasoning

Direct benchmark comparison between qwen3-235b-a22b-instruct-2507 and grok-4.20-beta-0309-reasoning based on LMArena Elo and latest API pricing.

Direct Technical Comparison

Frontier Model	LMArena Elo	API Cost (1M)	Throughput
qwen3-235b-a22b-instruct-2507	1422	$7.1e-8	11
grok-4.20-beta-0309-reasoning	1481	$0.000002	108

*These models represent the Pareto Frontier (optimal cost-to-performance).*

Conclusion: For developers looking for higher intelligence, grok-4.20-beta-0309-reasoning currently leads with an Elo of 1481.