Et ce qui s'en vient selon les experts. Synthèse pour dirigeants et décideurs.
Entre la sortie de GPT-5 (août 2025) et avril 2026, l'IA générative a franchi un cap. On quitte la phase du « copilote qui suggère » pour entrer dans celle de l'agent qui exécute. Mais les chiffres de terrain racontent une histoire plus nuancée.
Claude, GPT, Gemini et les challengers chinois offrent des capacités comparables. La différenciation se fait sur l'intégration, la gouvernance, la confiance et le coût — pas sur le benchmark brut.
40 % des applications d'entreprise intégreront des agents d'ici fin 2026 (Gartner). Le passage du chatbot qui aide à l'agent qui fait redéfinit les workflows et les rôles.
Gains de productivité par tâche : 14 à 55 %. La conversion en EBIT reste limitée tant que l'organisation ne redéssine pas ses processus, ses données et ses rôles.
Le prix du token a été divisé par 50 en trois ans. Mais seulement 12 % des organisations ont un contrôle centralisé sur leurs agents IA. C'est la plus grande lacune des dirigeants aujourd'hui.
Amodei et Altman parlent de capacités « niveau prix Nobel » d'ici 2027-2028. Hassabis donne « 50 % de chance d'AGI avant la fin de la décennie ». LeCun et Bengio appellent à la prudence. Tous s'accordent sur une chose : le rythme ne ralentit pas.
Cette note synthétise trois mois de recherche sur les grandes tendances 2026 — Stanford HAI, OCDE, McKinsey, BCG, Deloitte, Gartner, PwC, WEF, FMI, et les annonces officielles des laboratoires frontières.
Sept laboratoires pèsent sur le marché : Anthropic, OpenAI, Google DeepMind, Meta, xAI et la vague chinoise (Qwen, Kimi, GLM). En 18 mois, trois bascules majeures ont eu lieu.
OpenAI a ouvert la voie avec o3 et o4-mini (avril 2025). GPT-5 (août 2025), puis GPT-5.4 (mars 2026), ont intégré le raisonnement configurable. Anthropic, Google et les laboratoires chinois ont suivi : Claude Opus 4.6 extended thinking, Gemini 3.1 Pro Deep Think, Qwen 3, Kimi K2 Thinking — tous ciblent les tâches vérifiables (maths, code, diagnostic, vérification contractuelle).
Claude Opus/Sonnet 4.x, GPT-5.x, Gemini 2.5/3 Pro proposent une fenêtre de 1 million de tokens au tarif standard. Llama 4 Scout pousse jusqu'à 10 millions. Concrètement : on charge une base de code complète, un contrat de 500 pages ou l'historique complet d'un dossier client, sans découpage. On passe du résumé de page à la compréhension d'un corpus entier.
Qwen 3 (Alibaba), Kimi K2 (Moonshot) et GLM-5.1 (Zhipu) ont montré qu'un modèle quasi-frontière pouvait être entraîné à une fraction du coût. Résultat : le prix du token d'inférence a chuté d'environ 90 % en 18 mois. GLM-5.1 bat même GPT-5.4 sur le coding sous licence MIT. Llama 4 a consolidé l'option open-weights pour les entreprises qui veulent héberger elles-mêmes.
| Modèle phare | Sortie | Contexte | Point fort | Open weights |
|---|---|---|---|---|
| Claude Opus 4.6 (Anthropic) | Mars 2026 | 1M tokens | Coding + Agent SDK + Computer use | Non |
| GPT-5.4 (OpenAI) | 5 mars 2026 | 1M tokens | Meilleur all-rounder, écosystème ChatGPT Agent | Non |
| Gemini 3.1 Pro (Google) | 19 fév. 2026 | 1M tokens | Leader raisonnement (×2 vs 3 Pro), Agent Mode | Non |
| Grok 4 (xAI) | 2026 | Large | Co-leader coding avec Claude | Non |
| GLM-5.1 (Zhipu) | 2026 | Large | Bat GPT-5.4 en coding, licence MIT | Oui |
| Llama 4 (Meta) | Avril 2025 | 10M (Scout) | Open-weights, hébergement maison | Oui |
| Qwen 3 (Alibaba) | 2025-2026 | 1M tokens | Rivalise avec les frontières occidentales, leader open-weights | Oui |
| Kimi K2 (Moonshot) | 2025 | 128K tokens | Agent Swarm, raisonnement K2 Thinking | Oui |
La sprint février-mars 2026 a redessiné la frontière : Grok 4 et Claude Opus 4.6 dominent le coding, Gemini 3.1 Pro mène le raisonnement, GPT-5.4 reste le meilleur all-rounder, et GLM-5.1 bat GPT sur le coding en open-source.
Leader coding + Agent SDK + Computer use + 1M contexte
Meilleur all-rounder, ChatGPT Agent, plus grand écosystème
Leader raisonnement, Agent Mode, 750M utilisateurs
Qwen 3 rivalise avec les frontières occidentales ; GLM-5.1 bat GPT-5.4 en coding (MIT)
Open-weights pour auto-hébergement et agents swarm
Les grands cabinets convergent sur un paradoxe qui définit 2026 : l'adoption est massive, l'impact financier reste concentré chez une minorité.
Si votre stratégie IA, c'est juste d'économiser de l'argent, vous êtes déjà mort. Les vrais gains viennent de la réimagination de la chaîne de valeur.
— Andrew NgBCG parle de +47 % de marges opérationnelles chez les organisations en stade 4-5 de maturité IA. Stanford HAI observe une croissance de la productivité près de cinq fois plus rapide chez les leaders. Ce qui les différencie :
Si 2023-2024 était l'ère du chatbot et 2025 celle du copilote, 2026 est l'année de l'agent. Un chatbot répond, un copilote suggère, un agent exécute.
Claude Agent SDK, Computer Use, Claude Code, déploiements gérés en entreprise.
ChatGPT Agent (Operator + Deep Research + ChatGPT), lancé en juillet 2025.
Project Mariner, AI Mode dans Search, Agent Mode dans l'app Gemini.
Copilot Studio pour construire ses agents, intégrés à Microsoft 365 et Dynamics.
Agentforce — présenté comme le produit à croissance la plus rapide de l'histoire de l'entreprise.
Model Context Protocol (MCP) transféré à la Linux Foundation en déc. 2025. 1 000+ connecteurs. L'équivalent de HTTP pour les agents.
Harvey AI (valorisé 11 G$ en mars 2026) traite plus de 700 000 tâches/jour pour la majorité des 100 plus grands cabinets américains.
Harvey AIDevin, Cursor, Claude Code, GitHub Copilot Workspace permettent à de petites équipes de livrer ce qui nécessitait 3 à 5 fois plus de personnes.
Cursor · Claude CodeKlarna, Decagon, Sierra remplacent 50 à 70 % du volume de premier niveau par des agents.
Decagon · SierraDeep Research (OpenAI, Google, Perplexity) produit des revues de littérature de qualité analyste junior en quelques minutes.
Deep ResearchAgentforce, 11x.ai, Artisan automatisent la prospection et la qualification des leads.
Agentforce · 11x.ai88 % des organisations ont rapporté un incident de sécurité lié à un agent IA. Gartner prévoit 40 % des projets d'agents abandonnés d'ici 2027.
Int'l AI Safety Report 2026Le chantier des 18 prochains mois : la gouvernance, l'observabilité et l'auditabilité des agents — pas leur construction.
Entre janvier et avril 2026, trois événements ont redéfini le paysage de l'IA d'entreprise. Ils doivent figurer sur votre radar.
En janvier 2026, Anthropic a lancé Claude Code et Claude Cowork : des outils qui permettent de décrire ce qu'un logiciel doit faire en langage naturel et de laisser l'IA construire l'application. On appelle ça le vibe coding.
La réaction des marchés a été brutale. En mars 2026, plus de 1 000 G$ de capitalisation se sont évaporés du secteur SaaS — dont 300 G$ en une seule séance de bourse. Le modèle du « per-seat licensing » est remis en question : pourquoi payer 20 $/siège/mois pour un outil quand on peut vibe-coder sa propre version en une après-midi ?
Pour un dirigeant de PME : chaque renouvellement de licence SaaS doit maintenant se poser la question — est-ce qu'on achète, ou est-ce qu'on vibe-code ?
En avril 2026, Anthropic a annoncé Claude Mythos : son modèle le plus avancé à ce jour, mais sans accès public. Une première dans l'histoire des labos frontières. La raison : en quelques semaines de tests, Mythos a découvert des milliers de vulnérabilités zero-day, dont un bug de 27 ans dans OpenBSD.
Via Project Glasswing, l'accès est réservé à une dizaine de géants : AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Microsoft, Nvidia. Ils partagent ensuite leurs apprentissages avec le reste de l'industrie. C'est le premier signal qu'un modèle frontière est jugé trop dangereux pour une diffusion publique.
Mythos n'est pas sur l'API publique. Premier modèle frontière « sous firewall ».
Anthropic · avril 2026Milliers de vulnérabilités critiques trouvées ; plus vite que les équipes ne peuvent patcher.
AISI UK · Fortune10 géants (AWS, Apple, Google, MS, JPMorgan, Nvidia…) partagent les défenses avec l'industrie.
Conséquence : asymétrieL'ère où les capacités frontières étaient accessibles à tous via une API est en train de se terminer. Les meilleurs outils seront bientôt réservés à ceux qui peuvent les auditer et les défendre.
Le 30 janvier 2026, un projet nommé OpenClaw a débarqué sur GitHub. En quelques semaines, il a franchi 247 000 stars — l'une des croissances les plus rapides de l'histoire de GitHub. C'est un framework d'agents IA open-source, auto-hébergeable, compatible avec 200+ modèles (propriétaires et ouverts).
Pour les PME québécoises, c'est un signal fort : on peut désormais déployer un agent IA compliqué sans contrat enterprise à 50 000 $/an, sans envoyer ses données à un fournisseur américain, et en gardant la souveraineté sur ses données (crucial pour la Loi 25).
La lecture stratégique : le marché des agents se scinde en deux. D'un côté des stacks propriétaires premium (Agentforce, ChatGPT Agent, Glasswing). De l'autre des frameworks ouverts (OpenClaw) qui démocratisent l'accès. Les deux vont coexister.
L'AI Act européen entre en vigueur, le Canada attend toujours, le Québec applique déjà la Loi 25. Pour un dirigeant, ce n'est plus une option de repousser le sujet.
En avril 2026, une grande partie de l'AI Act est applicable : interdictions de certains systèmes (scoring social, reconnaissance émotionnelle au travail), obligations de transparence pour les GPAI, et premières obligations pour les systèmes à haut risque.
La Loi sur l'intelligence artificielle et les données (LIAD) incluse dans le projet de loi C-27 n'est toujours pas adoptée en avril 2026.
La Loi 25 s'applique pleinement depuis 2024. Pour les organisations qui utilisent l'IA, trois points critiques :
Le gouvernement américain peut contraindre les fournisseurs américains (OpenAI, Anthropic, Google, Microsoft, Meta) à remettre les données de leurs clients — même si ces données sont hébergées hors des USA.
Pour un dirigeant d'OSBL ou de PME québécoise, la Loi 25 n'est pas une option. Utiliser ChatGPT, Claude ou Gemini avec des données de clients ou de bénéficiaires sans encadrement formel expose l'organisation à un risque réel.
Les AI Safety Institutes (Royaume-Uni, États-Unis, Japon, Canada) évaluent systématiquement les modèles frontières avant leur mise en marché. Le International AI Safety Report 2026, coordonné par Yoshua Bengio et signé par 33 pays + UE, ONU, OCDE, est devenu le document de référence. Message central : les gouvernements disposent encore d'une fenêtre pour agir, mais elle se referme.
Le débat s'est déplacé. La question n'est plus « l'IA va-t-elle supprimer des emplois ? » mais quels emplois et à quelle vitesse ?
L'IA pourrait éliminer 50 % des emplois de bureau débutants dans les 1 à 5 ans. Le chômage pourrait grimper à 10-20 % si aucune action n'est prise.
L'IA risque d'enrichir les riches pendant que la plupart des travailleurs s'appauvrissent.
Les pertes d'emplois tech 2024-2025 sont surtout dues à la correction post-pandemie. Le vrai problème : un écart de compétences que les entreprises ne comblent pas.
Il faut une régulation internationale contraignante et une redistribution des gains de productivité, sinon la transition sera socialement insoutenable.
Sept tendances font consensus parmi les chercheurs, investisseurs et observateurs les plus crédibles pour 2026-2027.
40 % des applications d'entreprise intégreront des agents d'ici fin 2026 (Gartner). 85 % des entreprises prévoient de déployer des agents dans l'année (McKinsey).
Fei-Fei Li (World Labs, 1 G$), Hassabis et LeCun convergent : l'étape suivante n'est pas un meilleur LLM, c'est un modèle qui comprend l'espace, la physique et le temps.
Insilico Medicine a conduit en Phase IIa le premier médicament entièrement conçu par IA : 18 mois et 6 M$ contre 5-7 ans et 100 M$+ en approche traditionnelle.
Deloitte estime 15 000 unités livrées en 2026 (marché de 210-270 M$). Figure, 1X, Agility, Boston Dynamics, Tesla, Unitree, Xiaomi multiplient les partenariats industriels.
ChatGPT, Claude et Gemini intègrent une mémoire longue qui persiste entre conversations. Les IA personnelles qui connaissent votre contexte deviennent réalité.
61 % du capital-risque mondial est allé à l'IA en 2025 (258,7 G$). USA captent ~75 %, la Chine ~15 %, le Canada moins de 1 %.
Amodei : systèmes « niveau Nobel » en 2027-2028. Altman : « nous savons maintenant comment construire l'AGI ». Hassabis : 50 % de probabilité avant la fin de la décennie. Les systèmes qui arrivent feront une fraction croissante du travail cognitif — il faut s'y préparer dès maintenant.
L'AGI sera quelque chose comme dix fois l'impact de la Révolution industrielle, mais se produisant à dix fois la vitesse.
— Demis Hassabis, Davos 2026Six questions à se poser — et à poser à son équipe de direction — avant la fin de 2026.
Pas les 20 cas d'usage théoriques. Les 3 processus où : le volume est élevé, la valeur est réelle, les données sont disponibles, et la gouvernance est gérable. Concentrer les ressources plutôt que les diluer.
Politique d'usage, liste des outils autorisés, encadrement des données sensibles, formation obligatoire, registre des cas d'usage, processus d'approbation pour les agents autonomes. Si la réponse est floue, c'est la priorité numéro un.
Former 80 % du personnel aux usages de base (D1 : déléguer, D2 : décrire, D3 : discernement, D4 : diligence). Développer une vingtaine de « champions IA » par 100 personnes. Sans ce tissu, aucune technologie ne donne son plein potentiel.
Ancrer chaque projet IA à un KPI financier (revenu, marge, satisfaction client, temps de cycle). Un projet IA sans KPI lié au P&L est un projet qui va disparaître du budget 2027.
Le mono-fournisseur est un risque croissant. Une stratégie multi-modèles (Claude + GPT + un open-weights comme Llama) devient la norme. Ajouter une couche d'abstraction (routeur LLM, observabilité) pour limiter le lock-in.
L'IA n'est pas un outil neutre. Il y a des décisions que votre organisation ne doit pas déléguer à un modèle, des données que vous ne devez pas partager avec un outil tiers, des relations humaines que vous devez protéger. Écrire ces lignes rouges explicitement est autant une question d'éthique que de stratégie.
L'IA ne remplace pas les humains. Elle amplifie ce qu'ils font de mieux — quand on prend le temps de les préparer.
En avril 2026, l'IA n'est plus une technologie émergente : c'est une infrastructure. Les organisations qui s'en sortent le mieux sont celles qui prennent le temps de redéssiner leur façon de travailler.
Pour échanger : seb@kodra.ca · kodra.ca