Le vocabulaire IA et solo-build bouge vite et tout le monde le balance sans définition. Voilà les dix-sept mots qu'on croise tous les jours en 2026 quand on bosse en solo avec l'IA.
- AEO
Answer Engine Optimization. Optimiser un contenu pour qu'il soit lu, résumé et cité par les moteurs de réponse — ChatGPT, Perplexity, Claude, Google AI Overview — pas seulement listé dans une SERP.
L'utilisateur peut obtenir sa réponse sans jamais cliquer sur ton article ; ton enjeu c'est d'être la source que le LLM cite. Ce qui marche : définitions explicites, listes scannables, tableaux, FAQ structurée, Schema.org, citations datées et nommées. Voir rédiger un article qui rank.
- Agent
Modèle qui agit, pas seulement qui répond. Il a accès à des outils — terminal, navigateur, fichiers, API — et enchaîne des actions tout seul pour atteindre un objectif donné en langage naturel.
"Voici la commande à taper" → assistant. "J'ai ouvert le terminal, tapé la commande, lu le résultat, et corrigé le bug" → agent. Claude Code et Codex sont des agents. ChatGPT en mode chat simple, non.
- CLI
Command-Line Interface, ce qui se tape dans un terminal — opposé d'une interface graphique.
claude,codex,gh pr createsont des CLI. La majorité des outils IA pour devs en 2026 sont des CLI : plus rapide, scriptable, utilisable en SSH ou sur un serveur sans écran.- DA
Direction artistique. Les choix visuels qui définissent une marque : logo, typo, palette de couleurs, iconographie, mise en page, ton photo / illustration. La DA est ce qui rend une marque reconnaissable en 50 ms (Fogg, Stanford, 2002).
Pour un petit site solo en 2026, une DA propre tient en : 1 logo, 2 fonts (1 sans-serif UI + 1 serif body), 1 couleur d'accent, 1 librairie d'icônes, 1 grille typo modulaire. Tout est gratuit avec Nano Banana 2, Geist, Coolors, Lucide, Figma free. Voir Logo et DA d'un petit site.
- Distillation
Prendre un gros modèle et l'utiliser pour entraîner un plus petit qui imite ses réponses. Le petit perd un peu de qualité, gagne énormément en vitesse et en taille.
Gemma 4 est distillé depuis Gemini 3 ; Qwen 3.6 Coder depuis Qwen Max. C'est ce qui rend l'IA locale viable sur un MacBook ou une box à 1500 €.
- Frontier
Les modèles frontier sont ceux qui repoussent les limites — les plus capables du moment. En 2026 : Claude Opus 4.7, GPT-5.5 Pro, Gemini 3 Ultra. Top tier, propriétaire, cher (50-200 €/mois en abonnement, plusieurs euros par grosse requête en API). Opposé d'un modèle openweight ou local.
- ICP
Ideal Customer Profile. La personne très spécifique qui a le plus de chances d'acheter ton produit — pas un "marché cible" vague mais un persona précis : rôle, taille de boîte, problème exact, budget existant, déclencheur d'achat.
"Les SaaS B2B" → marché. "Head of Customer Success en SaaS B2B 50-200 personnes, 1000+ tickets/mois, prêt à payer 500 €/mois pour automatiser" → ICP.
L'intérêt n'est pas d'exclure les autres clients — c'est de concentrer marketing, produit et copy sur les 1-2 segments où tu convertis 10× mieux. Voir remplir sa fiche startup pour l'appliquer concrètement.
- Inference
Faire tourner un modèle déjà entraîné pour générer une réponse. Différent du training : pas de modification des poids, juste un calcul forward. Quand tu poses une question à Claude, c'est de l'inference. Le coût d'inference, c'est ce qui apparaît sur ta facture API ou qui chauffe ton GPU.
- Modèle
Un fichier — souvent plusieurs gigas, parfois plusieurs centaines — qui contient les poids entraînés d'un réseau de neurones. Ce qu'on charge en mémoire pour faire de l'inference.
Quand on dit "Claude Opus 4.7", on parle du modèle ; quand on dit "Claude Code", on parle du CLI/produit qui utilise ce modèle.
- Openweight
Modèle dont les poids (le fichier
.safetensorsou.gguf) sont distribués publiquement. Tu peux le télécharger, le faire tourner localement, le fine-tuner. Llama, Qwen, Gemma, Mistral, DeepSeek = openweight.À ne pas confondre avec open source stricto sensu : les datasets et le code d'entraînement ne sont pas toujours fournis. Mais "openweight" est le terme qui s'est imposé.
- PMF
Product-Market Fit. Le moment où ton produit rencontre un marché qui le veut vraiment — au point que les utilisateurs reviennent, paient, et te recommandent sans que tu pousses.
Mesurable : le test Sean Ellis (% d'utilisateurs qui se diraient "très déçus" si le produit disparaissait — seuil 40%), croisé avec une retention curve plate ou souriante sur 8-12 semaines, et un growth rate de 5-7% par semaine (référence YC).
Avant le PMF : tu pivotes, tu itères, tu repositionnes. Après le PMF : tu scales la distribution.
- Quantization
Réduire la précision des poids d'un modèle (FP16 → INT8 → INT4 → INT2) pour le faire tenir en mémoire et tourner plus vite. Tu perds un peu de qualité, tu gagnes énormément en vitesse et en RAM.
Concret : sans quantization, Qwen 3.6 Coder en local demanderait ~70 Go de RAM. Quantizé en
Q4_K_M, ~20 Go — ça passe sur un MacBook 32 Go.- SEO
Search Engine Optimization. Optimiser un contenu pour ranker dans la SERP Google — title tag, meta description, H1, mots-clés, internal linking, E-E-A-T, Core Web Vitals.
Les règles 2026 sont moins "trick Google" et plus "écrire dense pour humains" : Google et les LLMs convergent sur les mêmes signaux (dwell time, scroll depth, citations entrantes). En complément du SEO classique, tu fais aussi de l'AEO.
- SERP
Search Engine Results Page. La page que Google (ou Bing, DuckDuckGo, etc.) renvoie quand tu tapes une requête : les 10 liens bleus, les featured snippets, les "People also ask", les ads, l'AI Overview en haut.
L'enjeu d'un article SEO classique = ranker dans la SERP. L'enjeu d'un article AEO 2026 = être cité directement dans l'AI Overview ou par ChatGPT/Perplexity, sans passer par la SERP. Voir rédiger un article qui rank.
- SOTA
State-of-the-art. L'état de l'art, le meilleur niveau atteint à un moment donné sur un benchmark ou une tâche. "SOTA 2026 pour le code" = le modèle le plus fort en code en 2026. Souvent une façon de dire "cherche pas, prends le meilleur" — et ça change tous les trois mois. Voir la page SOTA.
- Tokens
Les unités que les modèles lisent et génèrent. Pas des mots, plutôt des sous-mots. "intelligent" peut être 1 token, "intelligence" 2, un mot rare 5. Compte ~1 token = 0,75 mot en français.
Les API facturent au token (input et output séparés), et les fenêtres de contexte se mesurent en tokens (200 k pour Claude Sonnet, 1 M pour Opus 4.7 1M, 2 M pour Gemini 3).
- Training
Entraîner un modèle, c'est lui montrer des milliards d'exemples pour qu'il ajuste ses poids et apprenne à prédire la suite d'un texte. Coût : des dizaines à centaines de millions d'euros pour un modèle frontier.
Pour un solo, training = jamais. Sauf fine-tuning à petite échelle (LoRA / QLoRA sur quelques milliers d'exemples), possible sur une 4090 ou via cloud à ~10 € la session — mais rarement utile dans la vraie vie.