Setup IA frontier : payer pour la SOTA

Tu lis ça parce que t'es soit (a) prêt à passer du setup gratuit au payant, soit (b) tu veux comprendre pourquoi tout le monde dit "Claude Code c'est dingue". Voilà.

Si t'as pas encore lu le Setup IA 100% gratuit, commence par là — c'est le baseline avant de payer quoi que ce soit.

Qu'est-ce qu'un modèle frontier

Modèle frontier = un modèle qui repousse l'état de l'art (en anglais : State Of The Art, abrégé SOTA). Tu vas voir le terme partout — sur Twitter, dans les papers, dans les benchmarks. Concrètement, "un modèle SOTA" ça veut dire "le meilleur du moment sur tel ou tel benchmark". Et un "frontier model" c'est un modèle qui pousse cette frontière vers l'avant.

C'est le terme utilisé par les labs eux-mêmes (Anthropic, OpenAI, Google DeepMind) pour désigner leurs flagships, et par le rapport AI Index de Stanford pour suivre cette catégorie.

En 2026, les frontier models sont :

Modèle	Provider	Open weights	Force
Claude Opus 4.7	Anthropic	non	Le meilleur agent, 1M tokens contexte, le plus reliable sur des longues sessions
GPT-5.5 Pro	OpenAI	non	Top reasoning, multimodal, écosystème large
Gemini 3 Pro	Google DeepMind	non	Multimodal, contexte long, intégration Google
Kimi 2.6	Moonshot	partiel	Ultra-long contexte (2M+ tokens), reasoning

Caractéristiques d'un frontier en 2026 :

Entraîné avec >10²⁵ FLOPs (seuil régulatoire EU AI Act)
Surpasse les générations précédentes sur les benchmarks SOTA (SWE-bench, GPQA, MMMU, AIME, etc.)
Disponible uniquement par API ou abonnement chez le lab qui l'a entraîné
Pas runnable en local (sauf Kimi en partie, mais hardware datacenter requis)

Les modèles open weights (Qwen, Gemma) sont près de la frontier sans être à la frontier. Concrètement : un Qwen 32B Coder fait ~75-80% du job d'un Opus 4.7 sur les tâches courtes, beaucoup moins bien sur le reasoning long ou les très grosses bases de code.

Pourquoi payer pour un frontier

Trois raisons concrètes pour un solo :

Vitesse de delivery. Tu codes 2 à 3× plus vite avec Opus qu'avec Qwen 14B local. Si tu factures à l'heure ou si tu vis du time-to-MVP, ça paye.
Reliability sur les longues sessions. Un 14B local pète son contexte ou oublie tes contraintes après 30-40 messages. Opus 4.7 tient des sessions de plusieurs heures avec son contexte 1M.
Tâches que les open weights ne font pas. Refactoring de gros codebase, raisonnement multi-fichiers profond, debugging complexe. Là, un frontier fait la différence.

Abonnement "chat" vs abonnement "coding" : la distinction qui compte

Les labs vendent deux produits différents sous des noms parfois similaires. Confondre les deux te fait soit payer pour rien, soit te frustrer parce que ton abo "chat" ne suffit pas pour coder.

Abonnement chat : accès à l'interface web ou mobile (claude.ai, chatgpt.com, gemini.google.com). Tu pose tes questions dans une zone de texte, tu reçois des réponses. Aucun accès à ton système de fichiers, aucun outil agentique.
Abonnement coding : accès à la CLI agentique (Claude Code, Codex CLI, Antigravity). Le programme modifie tes fichiers, lance tes commandes, itère sur tes tâches. C'est l'autre produit.

Souvent les abos coding englobent l'accès chat. L'inverse n'est pas vrai : ChatGPT Plus seul ne te donne pas Codex CLI illimité.

Les CLIs agentiques payantes

Claude Code (Anthropic)

La CLI agentique la plus mature actuellement. Sortie fin 2024, en avance sur tout le monde sur la qualité des tool calls et de l'agentic loop.

Doc : anthropic.com/claude-code
Pricing : anthropic.com/pricing

Tous les tiers donnent accès à Claude Code (CLI agentique) et à l'interface claude.ai :

Free : 0€/mois — accès limité à Sonnet (essai)
Pro : ~20€/mois — Claude Code avec Sonnet 4.6, quotas limités (sessions courtes)
Max 5× : ~100€/mois — 5× les quotas du Pro, accès partiel à Opus
Max 20× : ~200€/mois — Opus 4.7 1M context, quotas très généreux, le tier qui change vraiment ta vie de solo

API pay-per-use également disponible (souvent plus cher qu'un Max si tu codes 4h+/jour).

C'est ce que j'utilise sur tous mes projets clients. Si tu signes 1 client à 1.5k€ ce mois-ci, le Max 20× est amorti en une matinée.

Codex CLI (OpenAI)

La CLI agentique d'OpenAI, sortie en 2025. Codex est désormais inclus dans tous les plans ChatGPT (du Free au Pro), avec des quotas qui scalent par tier.

Doc / install : openai.com/codex
Pricing Codex : chatgpt.com/codex/pricing

Tous les tiers donnent accès à Codex (CLI agentique) et à l'interface chatgpt.com :

Free : 0€/mois — accès limité à Codex et GPT-5.3 (essai)
Go : 8€/mois — accès limité étendu à GPT-5.3, plus de messages et uploads
Plus : 23€/mois — quelques sessions de coding focused par semaine, modèles de raisonnement avancés, plugins (Slack, GitHub, Figma)
Pro : à partir de 103€/mois — sessions intensives quotidiennes, accès au reasoning GPT-5.5 Pro, accès au modèle Codex-Spark (research preview), quotas Codex max

Offre de lancement : sur le tier Pro à 103€/mois, OpenAI double les quotas Codex jusqu'au 31 mai 2026.

API pay-per-use disponible si tu préfères contrôler à la consommation.

L'agentic loop est moins peaufiné que Claude Code mais ça marche. À considérer surtout si tu préfères l'écosystème OpenAI.

Antigravity (Google)

Antigravity est la plateforme de dev agentique de Google, lancée en 2025. Elle combine un IDE et une CLI, branchée sur les modèles Gemini 3 Pro / Gemini 3 Ultra.

Pour chatter (interface gemini.google.com) :

Gemini Free
Google AI Pro : ~20$/mois

Pour coder via Antigravity :

Google AI Pro (~20$/mois) : Antigravity inclus, accès Gemini 3 Pro avec quotas
Google AI Ultra (~250$/mois) : Antigravity heavy, accès Gemini 3 Ultra et features avancées (Deep Research, etc.)

Avantage : intégration Google forte (Drive, Workspace). Inconvénient : moins mature que Claude Code sur le pur agentic.

Cursor (IDE-first)

Pas une CLI mais un IDE avec IA intégrée. Multi-modèles (Claude, GPT, Gemini), abonnement ~20$/mois.

cursor.com

Plus visuel, plus orienté "edit dans un fichier ouvert" que "agent autonome qui touche tout le repo". Bon compromis si tu préfères travailler dans un éditeur classique.

OpenCode + OpenRouter (pay-per-token)

Le combo malin si tu veux du frontier sans abonnement fixe.

OpenCode (CLI gratuite) + OpenRouter (agrégateur multi-provider) = tu accèdes à tous les frontier (Opus, GPT 5.5, Gemini 3 Pro, Kimi 2.6) via une seule clé API, et tu paies au token consommé.

export OPENROUTER_API_KEY=sk-or-v1-...
opencode
# Choisis OpenRouter, sélectionne un modèle :
# anthropic/claude-opus-4.7
# openai/gpt-5.5-pro
# google/gemini-3-pro-preview
# moonshot/kimi-2.6

Pricing à jour : openrouter.ai/models (cherche le modèle, prix au token visible).

Avantage : pas d'abo fixe, tu paies ce que tu consommes. Idéal si t'as un usage variable (une semaine intense, une semaine off). Inconvénient : tu perds les optimisations spécifiques à Claude Code (tool calls peaufinés par Anthropic). Ça reste très utilisable mais légèrement en dessous d'un Claude Code natif.

Coût indicatif Opus 4.7 via OpenRouter : ~15$ / 1M tokens input, ~75$ / 1M tokens output. Une session agentique de 2h consomme typiquement 200k à 500k tokens → ~5 à 15€.

Combien ça coûte vraiment, par mois

Setup	Coût mensuel	Type	Quand l'adopter
Cursor Pro	~20€	IDE	Tu fais peu d'agentic, tu veux juste un copilot évolué
Claude Pro	~20€	Coding (CLI)	Premier abo Claude Code, sessions courtes
ChatGPT Go	8€	Coding (CLI)	Essai étendu Codex, valider avant de monter
ChatGPT Plus	23€	Coding (CLI)	Quelques sessions Codex par semaine
Google AI Pro	~20€	Coding (CLI)	Antigravity, écosystème Google
OpenCode + OpenRouter	30 à 100€	Coding (CLI)	Usage variable, multi-modèles
Claude Max 5×	~100€	Coding (CLI)	Tu codes 2-3h/jour, accès partiel Opus
ChatGPT Pro	dès 103€	Coding (CLI)	Sessions Codex intensives quotidiennes, GPT-5.5 Pro
Claude Max 20×	~200€	Coding (CLI)	Tu codes 4h+/jour en agentic, tu vis dessus
Google AI Ultra	~250€	Coding (CLI)	Antigravity heavy, Deep Research

Les prix exacts changent. Vérifie anthropic.com/pricing, chatgpt.com/codex/pricing, gemini.google.com et openrouter.ai/models au moment où tu signes.

Mon arbitrage solo (mai 2026)

Claude Code + Opus 4.7 (Max 20× plan) sur les vrais projets clients
OpenCode + Qwen 3.6 14B local pour les expérimentations rapides et les tâches simples
OpenRouter pay-per-token en backup si je veux tester un modèle spécifique sans m'engager

Le Max 20× est amorti dès que je code 1h sur un projet client.

Quand passer du setup gratuit au frontier

Quatre signaux clairs :

Tu signes ton premier vrai client (>500€). Le ROI est immédiat — paie le mois en cours.
Tu perds plus de 30 min par jour à corriger les sorties d'un modèle 14B. Le coût opportunité dépasse l'abo.
Tu travailles sur du code de >50k lignes. Les open weights décrochent. Frontier obligatoire.
Tu fais des sessions multi-heures sur le même problème. Le contexte 1M d'Opus change la donne.

À l'inverse, reste sur le setup gratuit si :

Tu apprends ou tu valides des hypothèses
Tu fais surtout du scaffolding ou des petits scripts
T'as pas encore signé un seul client

Les abonnements à éviter au démarrage

GitHub Copilot 10$/mois : utile pour de l'autocomplétion, pas agentic. Insuffisant tout seul si t'as déjà Claude Code ou Codex.
Tous les "GPT wrappers" qui te vendent des prompts : prends Claude Pro à la place et pilote toi-même.
Multi-abonnements en parallèle au démarrage : un seul, focus.
Acheter le tier maximal avant d'avoir un usage réel : commence par le Pro, monte au Max quand tu sens vraiment les limites.

La règle du solo

Paie pour un frontier seulement quand chaque heure que tu lui fais gagner se transforme en heure facturable.

Avant ça, le setup gratuit suffit largement.