Skip to main content

Home Discover News Discussions Lists Providers Leaderboard Compare Requests Blog

Home Discover News Discussions Lists Providers Leaderboard Compare Requests Blog

BenchMark'dCommunity-driven AI model reviews

Discover Leaderboard Discussions Lists News Providers Compare Requests Blog Sign In

Privacy Policy|Terms of Service

Real reviews of AI models, by real people.

Claude Opus 4.6 Sets New Benchmark Records Across Coding and Reasoning | BenchMark'd

Model Release

Claude Opus 4.6 Sets New Benchmark Records Across Coding and Reasoning

Anthropic Blog·May 15, 2025(May 15, 2025)

Anthropic's latest flagship model Claude Opus 4.6 achieves state-of-the-art performance on SWE-bench, GPQA, and MATH benchmarks, cementing its position as the most capable coding assistant available.

anthropicclaudebenchmarkscoding

Originally published on Anthropic Blog

Related Models

Claude Opus 4.6

Anthropic

1 review

Claude Opus 4

Anthropic

4 reviews

Explore more