décembre 2025
Une réflexion franche sur le battage autour de l’IA en 2025 et le FOMO des développeurs, incitant à se concentrer sur les fondamentaux et la livraison de vraies fonctionnalités plutôt que de courir après chaque nouvel outil.
Une analyse franche expliquant qu’OpenAI lance souvent des avancées majeures mais est rapidement dépassée, et que son véritable atout—et sa stratégie—est de dominer l’expérience de chat par défaut plutôt que d’être premier sur toutes les capacités.
Theo soutient qu’OpenAI lance régulièrement des innovations majeures mais se fait rapidement dépasser par Google et Anthropic pour le code, les images, les documents, les outils et la navigation, tout en restant gagnant grâce à son statut d’application de chat par défaut qui retient les utilisateurs.
Aperçu de la dernière mise à jour de Claude Code : sous‑agents pour tâches asynchrones, mode UltraThink de raisonnement approfondi, nouvelle intelligence de code via LSP, tests dans le navigateur Chrome, intégrations Android et Slack, améliorations de la barre d’état et des raccourcis, ainsi que l’extension des Skills au format ouvert.
Présentation et démonstration de l’utilisation des sous‑agents de Claude Code CLI pour paralléliser la recherche et l’implémentation tout en gardant une petite fenêtre de contexte dans le fil principal pour des modifications de code plus rapides et de meilleure qualité.
Une synthèse dynamique du rapport 2025 d’OpenRouter sur l’IA, mettant en avant l’essor chinois des modèles open-weight, la prédominance des usages en jeu de rôle et en code, et la transition rapide vers le raisonnement et l’inférence agentique.
Un test pratique de GLM‑4.7 de Z AI met en évidence de nets progrès en codage agentique et en créativité via des commandes vocales d’un OS navigateur, des simulateurs d’impression 3D et de combat aérien, des démos de batterie et de jeux, ainsi que des sites web décalés, avec quelques reprises nécessaires pour les tâches complexes.
Un test en direct de la nouvelle extension Chrome de Claude par Anthropic montre le contrôle du navigateur, l’intégration avec Claude Code pour créer une application web locale, ainsi que la configuration de Firebase avec connexion Google et vérification des données de bout en bout.
Un développeur explique comment l’épuisement et le scepticisme ont laissé place à l’adoption totale d’outils d’IA pour coder, en montrant des workflows agentiques pratiques qui accélèrent la vitesse et la satisfaction tout en soulignant limites et risques.
Les animateurs passent en revue les plus grandes surprises de l’IA en 2025 et débattent de GPT‑5.2, d’Opus 4.5 et de Gemini 3 Flash, puis formulent des prévisions pour 2026 côté entreprise et grand public, évoquent les agents de code, les coûts et le tooling, et se demandent si nous sommes dans une bulle IA.
Le créateur évalue un cluster de quatre Mac Studio utilisant le nouveau RDMA via Thunderbolt d’Apple et Exo 1.0 pour répartir et chaîner d’énormes LLM, montrant de fortes baisses de latence et des gains de débit de tokens par rapport à l’Ethernet, tout en comparant le scaling des modèles denses et MoE, la consommation et les limites logicielles actuelles.
Une présentation concise de TanStack AI montrant comment créer une application de chat typée avec réponses en streaming et des outils côté serveur et client en quelques lignes de code React et serveur.
Theo soutient que, malgré d’excellents scores aux benchmarks, GPT‑5.2 paraît moins bon en usage réel — régressant en raisonnement, en suivi d’instructions et en vitesse par rapport à d’autres — et montre, via ses propres évaluations pratiques, pourquoi les benchmarks comptent de moins en moins.
Une démonstration pratique de Beads pour offrir aux agents de code une mémoire durable et partageable grâce à un graphe d’incidents versionné par Git et des flux CLI/UI.
Theo teste les nouvelles fonctionnalités de Claude Code d’Anthropic — sous‑agents asynchrones et tâches en arrière‑plan — avec un parallélisme impressionnant et du potentiel, mais aussi de nombreux bugs et aspérités UX frustrants.
Nik Pash soutient que l’efficacité des agents de codage IA dépend moins des échafaudages sophistiqués et davantage de modèles puissants entraînés via des benchmarks rigoureux et des environnements RL, en partageant les leçons de Cline sur la création de vérificateurs et l’automatisation d’évaluations issues du réel.
Première prise en main du modèle multimodal GLM‑4.6V de ZAI, avec des tests de son usage natif d’outils et de ses capacités impressionnantes d’image vers code : réplication d’UI, conversion croquis‑vers‑site, éditions interactives et démo d’un OS dans le navigateur.
Un tour d’horizon concret et rythmé de 50 usages de l’IA — du chat, de la mémoire et de la recherche web à la génération d’images/vidéos, d’audio/musique, de diaporamas, jusqu’à la publication d’une application mobile avec paywall — montrant comment combiner modèles et API pour doper le travail et la création de contenu au quotidien.
Theo explique l’acquisition de Bun par Anthropic, pourquoi elle s’aligne avec la stratégie de Claude Code, et pourquoi Bun restera open source tout en accélérant les outils JS pour le développement piloté par l’IA.
Synthèse et benchmarks des agents de codage IA de décembre 2025 comparant Opus 4.5, Gemini 3.0 Pro et GPT‑5.1 sur des harnais populaires, mettant en avant la constance d’Opus, la sensibilité de Gemini au harnais et la variabilité de GPT‑5.1.