Tetris HTML — qui va le plus vite ?HTML Tetris — who ships fastest?
On démarre avec Grok Composer 2.5 et Claude Opus (effort ultra code + subagents) sur le même brief Tetris. Sonnet arrive ensuite — Opus était trop lent et buggué. Objectif : comparer vitesse et qualité du livrable, pas un benchmark scientifique.We start with Grok Composer 2.5 and Claude Opus (ultra code effort + subagents) on the same Tetris brief. Sonnet joins later — Opus was too slow and buggy. Goal: compare delivery speed and output quality — not a rigorous benchmark.
Vidéo récap à venir L'URL YouTube sera ajoutée ici.
Recap video coming soon The YouTube URL will be embedded here.
Récap monté ~59 s · intro/outro Roxabi · son léger · source OBS 59 min compressée~59 s edited recap · Roxabi intro/outro · light audio · 59 min OBS source compressed
Grok · Composer 2.5
DuréeDuration~2 min rapidefast
FichierOutput1 × index.html
RelancesRestarts00
DépartStartdès le brieffrom the brief
Claude · Sonnet
DuréeDuration~2 min 10 rapidefast
EffortEffortmedium
AjoutAddedaprès blocage Opusafter Opus stalled
RelancesRestartsstop + recommencerstop + restart
Claude · Opus Ultra
DuréeDuration~50 min lentslow
EffortEffortultra code + subagents
DépartStartdès le brief (face à Grok)from the brief (vs Grok)
RelancesRestartsrelancé (bugs conservés dans la vidéo)restarted (bugs kept in the video)
Qualité comparable à Grok en à peine plus de temps. Bon choix effort/rapidité.Comparable quality to Grok in slightly more time. Good effort/speed trade-off.
Over-engineering visible : infra de tests, commentaires massifs, complexité hors brief.Visible over-engineering: test infra, heavy comments, complexity beyond the brief.
On ne part pas avec trois agents. D'abord Grok + Opus ultracode ; Sonnet n'arrive qu'après le blocage d'Opus. Même consigne Tetris pour tous, mais pas le même timing de lancement.We didn't start with three agents. Grok + Opus ultracode first; Sonnet only after Opus stalled. Same Tetris brief for everyone, but not the same launch timing.
Le brief a été refait 2–3 fois. Claude s'est arrêté net à plusieurs reprises — comme un blocage côté infrastructure. La vidéo garde ces incidents (STALL Opus, reset, stop + restart Sonnet).The brief was rerun 2–3 times. Claude stalled completely several times — felt like an infrastructure issue. The video keeps those incidents (Opus STALL, reset, Sonnet stop + restart).
Opus + Ultra n'est pas toujours la bonne réponse. Sur une demande basique, ça pousse à l'over-engineering sans raison claire.Opus + Ultra isn't always the right call. On a basic request it drifts into over-engineering without a clear payoff.
Grok est très rapide, mais Sonnet peut matcher ce rythme avec le bon niveau d'effort.Grok is very fast, but Sonnet can match that pace with the right effort level.
Un test « simple » révèle beaucoup. Il met surtout en lumière les problématiques Claude plus que la surperformance de Grok.A "simple" test reveals a lot. It highlighted Claude's pain points more than Grok's outperformance.
Notre lecture : ce n'est pas un benchmark rigoureux — c'est un témoignage terrain. Pour un Tetris one-file, Sonnet medium ou Composer 2.5 suffisent. Opus Ultra a du sens quand la complexité le justifie, pas par défaut.Our take: this isn't a rigorous benchmark — it's a field report. For a one-file Tetris, Sonnet medium or Composer 2.5 are enough. Opus Ultra makes sense when complexity warrants it, not by default.
Le brief (même consigne Tetris)The brief (same Tetris spec)
Tetris complet en un seul index.html autonome — pas de CDN, pas de build. Grok et Opus ultracode partent ensemble ; Sonnet rejoint plus tard. Détails dans DEMANDE.md · plan vidéo.Full Tetris in a single self-contained index.html — no CDN, no build. Grok and Opus ultracode start together; Sonnet joins later. Details in DEMANDE.md · video plan.