Actualités de août 2025

Le contexte 1M de Claude dans Cursor : du rêve au désastre

Vidéo

31 août 2025 • Ray Fernando

Un stress test en direct du contexte à 1M de jetons de Claude Sonnet 4 dans Cursor construit un éditeur de transcription, plante à cause de phases incomplètes et montre comment un seul appel d’outil MCP peut consommer silencieusement ~800k jetons et faire chuter les performances.

OpenAI a accidentellement rendu l’IA trop humaine

Vidéo

30 août 2025 • Ray Fernando

Démo du nouveau modèle temps réel d’OpenAI montrant des interactions vocales naturelles et audacieuses, un traitement unifié de la parole et des fonctions pour développeurs comme l’entrée d’images, les appels SIP, l’intégration MCP et l’exécution asynchrone de fonctions.

Concevoir des workflows d’agents plus sûrs avec les types Convex et MCP

Vidéo

29 août 2025 • Convex

Tom Ballinger montre comment les types de bout en bout de Convex et une application de chat propulsée par MCP permettent des workflows d’agents plus sûrs et plus prévisibles, tout en mettant en avant les risques comme l’injection de prompts, les flux de jetons et la conception des permissions.

J’ai essayé de créer une application full‑stack avec le codage agentique (Claude + Cursor)

Vidéo

29 août 2025 • Web Dev Cody

Web Dev Cody crée une appli full‑stack type YouTube avec du codage agentique via Claude et Cursor, intégrant Cloudinary pour les uploads, chapitres, transcriptions et aperçus, et ajoute profils, tags, abonnements, commentaires, likes, notifications et vidéos liées tout en démontrant un flux de travail assisté par l’IA.

Faut‑il utiliser GPT‑5 et Codex maintenant ?

Vidéo

29 août 2025 • GosuCoder

Un test pratique de GPT-5 avec Codex IDE, Remote Agents et CLI met en avant des performances plus rapides, une génération de code de haute qualité et des flux locaux–cloud fluides, tout en pointant des manques de fonctionnalités et des irritants UX comme l’approbation obligatoire des fichiers et une sortie CLI bruyante.

Un LLM local peut-il VRAIMENT être votre développeur au quotidien ? Framework Desktop avec GLM 4.5 Air et Qwen 3 Coder

Vidéo

27 août 2025 • GosuCoder

Le créateur évalue si des LLM locaux peuvent gérer le développement quotidien en comparant GLM 4.5 Air, Qwen 3 Coder, GPT OSS 120B et d'autres sur un Framework Desktop et un RTX 5090, et conclut qu'un flux hybride—petits modèles rapides pour l'exécution et grands modèles lents pour la planification sans boucles agentiques—est le plus efficace.

Monstre LLM quasi silencieux... NVIDIA, prenez des notes

Vidéo

25 août 2025 • Alex Ziskind

Prise en main des cartes Framework Desktop avec AMD Ryzen AI Max+ 395 pour exécuter de grands modèles d’IA en local en silence, avec benchmarks des modes mémoire, performances Vulkan vs ROCm et comparaisons avec Apple M4/M4 Max et GMKTEC Evo X2.

Flux de travail des sous-agents Claude (démo complète)

Vidéo

24 août 2025 • Ray Fernando

Une démonstration pratique montrant comment créer et orchestrer des sous-agents spécialisés de Claude pour refactorer l’UI d’une application réelle, exécuter des revues itératives et automatiser des corrections sur desktop et mobile avec des fenêtres de contexte séparées.

DeepSeek v3.1 : une mise à jour meilleure que prévu... MAIS ?

Vidéo

24 août 2025 • GosuCoder • 16m 48s

Un test pratique de DeepSeek v3.1 montre de gros progrès en appel d’outils structuré et en workflows de code (notamment via Claude Code), des capacités agentiques plus efficaces et de meilleurs benchmarks, mais avec un débit lent et des problèmes ponctuels comme des chaînes chinoises inattendues dans le code.

L’état actuel de GPT-5

Vidéo

22 août 2025 • Theo - t3.gg • 46m 44s

Theo explique pourquoi le lancement chaotique de GPT‑5 a semblé décevant—soutenant que le modèle est solide mais freiné par le routage et l’UX de couches comme ChatGPT et Cursor—et compare ses capacités réelles à celles des concurrents pour le code et les tâches longues avec outils.

Playwright MCP + extension Chrome : tests avec profils connectés

Vidéo

21 août 2025 • Debbie O'Brien • 6m 53s

Démonstration de l’extension navigateur Playwright MCP montrant comment se connecter à un profil Chrome/Edge déjà connecté afin qu’un agent exécute des tests sur des sessions authentifiées et effectue des modifications sans partager d’identifiants.

Je teste ChatGPT5 avec Junie (l'agent de Jetbrains)

Vidéo

18 août 2025 • Grafikart.fr • 30m 34s

Un test en français de GPT‑5 sur trois tâches de dev réelles—CRUD Laravel avec guidelines, une grille de mots en React et un prototype du jeu de société Lacuna—mettant en avant forces, limites et flux d’agents dans JetBrains.

Les LLM locaux sont-ils enfin bons en code ? Qwen 3 Coder 30B

Vidéo

18 août 2025 • GosuCoder • 24m 1s

Le créateur compare Qwen 3 Coder 30B à DevStral Small et GPT OSS 20B, montrant une forte fiabilité des appels d’outils, un débit élevé de jetons et des démos de code pratiques sur un RTX 5090.

Ce modèle pourrait devenir mon préféré (pour le codage agentique)

Vidéo

15 août 2025 • Web Dev Cody • 24m 17s

Web Dev Cody compare GPT-5 et Claude Opus pour le codage agentique en implémentant un drapeau d’accès anticipé et une page d’accueil, en discutant de la vitesse, de la fiabilité et des stratégies de prompt.

Je me suis trompé sur GPT-5

Vidéo

14 août 2025 • Theo - t3.gg • 31m 27s

Theo explique en quoi sa première expérience positive avec GPT‑5 différait du déploiement public, détaille les erreurs de lancement, la dégradation des performances dans les outils et précise qu’il n’a pas été rémunéré.

Ce modèle open weight est une bête de code… GLM 4.5

Vidéo

14 août 2025 • GosuCoder • 14m 57s

Un retour d’expérience sur GLM 4.5 pour le code montre qu’il est rapide, efficace et excellent pour de petites tâches orientées UI, mais limité par sa fenêtre de contexte et des coûts possibles sur des enchaînements plus longs.

Les hooks Claude Code sont officiellement géniaux

Vidéo

13 août 2025 • Web Dev Cody • 5m 28s

Une démo rapide explique comment utiliser les hooks de Claude Code pour déclencher une notification vocale personnalisée générée par IA à la fin d’une exécution d’agent, avec OpenAI pour le texte et ElevenLabs pour la synthèse vocale, ainsi qu’un bref tour des événements de hooks et des matchers.

GPT 5 est déroutant… j’ai mis trop de temps à comprendre ce truc

Vidéo

12 août 2025 • GosuCoder • 19m 40s

Après environ 50 millions de jetons avec GPT‑5, l’auteur montre que configurer faible raisonnement et faible verbosité accélère fortement les workflows de code par rapport au raisonnement moyen, tout en opposant les points forts de GPT‑5 (suivre des specs précises, débogage) et ses limites (idéation, refactorings vagues) face à Sonnet et autres.

Anthropic a des vibes bizarres

Vidéo

11 août 2025 • Theo - t3.gg • 20m 25s

Un regard critique sur les pratiques d’Anthropic concernant les restrictions d’accès, l’open source, les prix et les relations développeurs, en affirmant que leur avantage s’estompe face à la nouvelle concurrence.

Vous utilisez mal les outils de codage IA

Vidéo

10 août 2025 • Theo - t3.gg • 43m 19s

Theo explique que le code n’a jamais été le goulot d’étranglement et montre comment utiliser l’IA pour prototyper, itérer et valider rapidement les idées afin d’améliorer la compréhension d’équipe et le résultat produit plutôt que de générer du code de production.

GPT-5 détrône-t-il Claude Sonnet ?

Vidéo

9 août 2025 • Convex • 27m 55s

Un ingénieur de Convex compare GPT-5 et Claude Sonnet en construisant une application Morpion multijoueur en TypeScript avec un backend Convex, révélant des points forts en génération de code, des bizarreries d’appel d’outils, des différences d’UI et des résultats mitigés lors de l’ajout de l’authentification.

Les résultats sont tombés pour GPT-5...

Vidéo

8 août 2025 • GosuCoder • 18m 29s

Un benchmark pratique de GPT‑5 sur 10 assistants de code montre un modèle de programmation solide et abordable qui atteint la barre des 25k sans prendre la première place, avec des bizarreries notables dans les longues boucles d’agent, la gestion d’environnement et quelques appels d’outils imprévus.

OpenAI publie enfin des modèles à poids ouverts, mais savent-ils vraiment coder ?

Vidéo

7 août 2025 • GosuCoder • 14m 31s

Un test pratique des modèles MoE à poids ouverts 120B et 20B d’OpenAI montre une grande vitesse et un raisonnement correct en discussion, mais des performances incohérentes et peu fiables pour le codage agentique et l’usage d’outils selon les fournisseurs et les températures.

Les modèles open source d’OpenAI sont enfin là

Vidéo

6 août 2025 • Theo - t3.gg • 30m 35s

Theo analyse les nouveaux modèles open‑weights de 120B et 20B d’OpenAI, en testant les performances locales et cloud, la fiabilité des outils, les benchmarks et les compromis pratiques pour les développeurs.

GLM 4.5‑Air‑106B et Qwen3‑235B sur AMD « Strix Halo » AI Ryzen MAX+ 395 (HP Z2 G1a Mini Workstation)

Vidéo

5 août 2025 • Donato Capitella

Comment exécuter de très grands LLM sur des systèmes AMD Strix Halo sous Linux grâce à la mémoire unifiée, avec étapes pratiques de configuration, compromis Vulkan/ROCm et benchmarks sur un HP Z2 Mini G1a.

Claude Code : le guide que 95% des devs devraient voir

Vidéo

5 août 2025 • Alex so yes • 39m 4s

Une masterclass en français explique l’installation, la configuration et l’usage de Claude Code dans VS Code et en CLI—commandes, mémoire, MCP, agents parallèles et mode YOLO sécurisé pour accélérer les workflows de dev réels.

Comment créer des agents IA en temps réel avec les composants Convex

Vidéo

4 août 2025 • Convex • 20m 26s

Une présentation expliquant comment créer des workflows d’agents IA en temps réel et orientés code sur Convex avec TypeScript, couvrant fils de discussion, streaming de messages, récupération de contexte, RAG, limitation de débit et workflows durables pouvant être mis en pause, repris et mis à l’échelle.

Qwen 3 Coder à 2000 tokens par seconde et un prix raisonnable, trop beau pour être vrai ?

Vidéo

4 août 2025 • GosuCoder • 13m 19s

Un test pratique évalue l’abonnement Qwen 3 Coder de Cerebras : appels d’outils solides et légère perte de qualité en FP8, mais un débit réel bien inférieur aux 2 000 tokens/s annoncés et des limites quotidiennes de tokens qui conditionnent l’usage.

Live coding avec Warp

Vidéo

2 août 2025 • James Q Quick • 1h 59s

Une session en direct où le terminal agentique Warp sert à créer l’ossature d’une extension Chrome et d’un backend TypeScript/Express, en démontrant des workflows d’agents en parallèle, des diffs intégrés, un suivi des tâches et une fonctionnalité de traduction de ton en temps réel.

Comment créer un serveur MCP ?

Vidéo

1 août 2025 • Grafikart.fr • 35m 37s

Un guide pratique qui explique le MCP (Models-Context-Protocol) et montre comment implémenter un serveur (HTTP + JSON-RPC) avec ressources, outils et prompts, puis le tester avec un inspecteur, VS Code Copilot et Gemini.

Actualités de août 2025

Jacky THIERRY