Compétence techniqueDonnées & IA

Données, IA & Machine Learning

RAG et workflows LLM chez ACCENSEO, ML scoring chez AdsPower, ETL Ligneurs chez Pichet. Compétence montée par les besoins réels du business, pas par hype cycle.

Compétence techniqueDonnées & IA

Données, IA & Machine Learning

RAG et workflows LLM chez ACCENSEO, ML scoring chez AdsPower, ETL Ligneurs chez Pichet. Compétence montée par les besoins réels du business, pas par hype cycle.

Confiance personnelle

4.1/5· Expert

◆

FondamentalEn développementOpérationnelAvancéExpert

Évolution de cette compétence dans le temps

Ma définition

Les données, l'IA et le ML, c'est pour moi la compétence qui transforme événements et textes en décisions. Ça couvre les bases relationnelles et NoSQL, la dataviz (Apache ECharts, dashboards business), l'ingénierie des données, les fondamentaux du machine learning et les workflows LLM appliqués (RAG, agentic, évaluation). C'est l'axe stratégique explicite de mon projet 2026-2028 : agents de code intégrés au cycle de développement, LLM agentique qui orchestre des actions réelles plutôt que des réponses, nouveaux cycles dev agentiques (spec → review → test → refactor → doc) augmentés par l'IA, et workflows organisationnels d'entreprise repensés autour des agents IA - de l'idéation produit à la livraison en prod.

Voilà mes 4 chantiers en parallèle, classés par priorité 2026 :

Agentique dev et organisationnel : MCP servers branchés sur l'environnement local, agents de code câblés à mon cycle de dev quotidien sur le SaaS comptable, workflows agentiques sur spec / review / tests / doc, orchestration n8n et Workato côté chantiers clients.
LLM-Ops production : RAG hybride et agentique dans le pipeline ACCENSEO (contextual retrieval + BM25 + reranker), eval LLM-as-judge sur les sorties critiques, monitoring token cost, latence et drift, routing multi-fournisseur (Claude, GPT, Gemini) par typologie de tâche, context engineering comme discipline transverse.
Ingénierie de données à l'échelle SaaS : enrichissement vision-language et 3D, embeddings et vector search via pgvector pour le RAG ACCENSEO, modélisation type-safe Prisma (~91 modèles sur le SaaS comptable, 98 sur le SaaS courtiers), MongoDB et PostgreSQL en production sur plusieurs centaines de Go de RAM chez ACCENSEO, pipelines ETL custom (Akeneo Ligneurs, Pichet 2019-2023), SQL avancé.
Fondamentaux ML : sur AdsPower (2016-2018), classifications supervisées pour la prédiction de bid (Google AdWords, Bing Ads, Facebook Ads), clustering k-means pour la détection de mots-clés négatifs et NLP multilingue TF-IDF + NLTK sur 10M+ requêtes par mois, le tout entraîné sur Azure ML Studio.

C'est ce socle - discipline d'engineering des entrées (feature engineering hier, context engineering aujourd'hui), fallback heuristique en cas d'incertitude modèle, monitoring quality score, latence sub-seconde - qui me permet d'évaluer un modèle génératif sans confondre démo et production. Compétence Expert (7/10, score 4.1/5) en consolidation vers la cible 8/10, sur la pile complète : data engineering + ML appliqué + LLM-Ops + agentic dev.

Quatre chantiers parallèles 2026 : agentique dev (MCP, agents de code, n8n), LLM-Ops production (RAG hybride, routing Claude/GPT/Gemini, monitoring), ingénierie de données SaaS (Prisma, pgvector, MongoDB) et fondamentaux ML (Azure ML Studio, k-means, NLP TF-IDF) — Jose DA COSTA

En 2026, le sujet n'est plus « quel LLM choisir » mais « quels agents orchestrer et sur quel contexte les brancher ». Les agents IA sont passés du POC à la production en 18 mois : le Anthropic 2026 Agentic Coding Trends Report confirme que 22% des développeurs utilisent déjà des agents de code et 66% des entreprises prévoient leur adoption sous 12 mois ; VentureBeat formalise le pattern dans Agentic coding at enterprise scale demands spec-driven development, avec des cycles spec → review → test compressés de semaines à jours (Kiro, AWS, Amazon). LangChain pousse la thèse plus loin dans Agentic Engineering: How Swarms of AI Agents Are Redefining Software Engineering : on passe d'un agent isolé à des essaims orchestrés avec rôles définis, mémoire partagée et couche d'observabilité commune. Le moat compétitif d'un SaaS B2B vertical n'est plus dans le LLM choisi mais dans le contexte qu'on donne à ses agents - données propriétaires permissionnées, retrieval orchestré, eval rigoureuse, garde-fous d'exécution, et conformité AI Act intégrée dès la conception. Anthropic, dans Contextual Retrieval in AI Systems, a publié un protocole qui réduit les échecs de retrieval de 49% seul et 67% combiné à un reranker - nouvelle baseline production. Microsoft Azure prolonge dans 10 RAG Shifts Redefining Production AI in 2026 : la couche retrieval bascule du pipeline monolithique vers une orchestration composable (late-interaction ColBERT, GraphRAG, retrieval attribution, counterfactual testing, streaming RAG). En France, ToHero - Agentique en 2026 et aiacto - Agents IA en entreprise selon l'AI Act rappellent qu'à partir du 2 août 2026, les agents IA classés à haut risque doivent être traçables, supervisables et interruptibles (Article 14 AI Act), avec sanctions jusqu'à 15 M€ ou 3% du CA mondial. Le CTO qui sait orchestrer des agents industrialisés - spec-driven development, eval LLM-as-judge, drift detection, cost per feature, audit trail AI Act - sur un domaine régulé devient recherché.

Mes éléments de preuve

Réalisation

Anecdote 1 : Co-fonder AdsPower autour des pipelines ML AdTech

En janvier 2016, j'ai co-fondé AdsPower comme CTO et Chef de projet technique d'une startup early-stage sans investisseur externe. Le pari : concurrencer Optmyzr (US) et Dolead (FR) avec une approche ML-first pour optimiser automatiquement les enchères Google AdWords, Bing Ads et Facebook Ads. Le marché était dominé par des moteurs de recommandations heuristiques, et Azure ML Studio venait juste de sortir de preview - on avait une fenêtre, mais aussi un défi : la rareté des compétences ML à Bordeaux en 2017 et un runway limité.

J'ai monté un pipeline ML complet : un Data Collection Service branché sur les API Google AdWords + Bing Ads + Facebook Ads SDK, un SERP Scraper custom (Goutte + CasperJS) couvrant 6 moteurs (Google, Bing, Yahoo, Yandex, Baidu, DuckDuckGo) et absorbant plus de 10 millions de requêtes par mois via cache Memcached + queue Redis, et un sidecar Python Flask intégrant NLTK + TF-IDF pour le NLP multilingue. Côté modèles, j'ai entraîné sur Azure ML Studio des classifications supervisées pour la prédiction de bid, des clusters k-means pour la détection de mots-clés négatifs, et la Google Prediction API pour la segmentation d'audience. La stack applicative : Symfony 3.2 + Angular avec builds Electron desktop (Mac/Windows/Linux) et Cordova mobile (iOS/Android). Pour sourcer les freelances ML, j'ai fait des recherches GitHub géolocalisées sur les tags machine-learning.

3 itérations produit majeures livrées en moins d'un an avec une équipe de 4 freelances que j'ai pilotée comme Technical Project Manager, plateforme couvrant 3 régies publicitaires (Google, Bing, Facebook) avec recommandations en moins de 500 ms, et 3 bêta-testeurs actifs sur la v1 de novembre 2016.

Cette aventure m'a appris dans la chair que classification + bid optimisation peuvent être productisées - pas juste démontrées en notebook. Les réflexes que j'y ai forgés (latence sub-seconde, fallback heuristique en cas d'incertitude modèle, monitoring du quality score) sont exactement ceux que je rejoue aujourd'hui sur les workflows LLM ACCENSEO. AdsPower n'a pas trouvé son PMF avant l'épuisement du runway, mais il a été ma première école production ML.

Voir la réalisation

Réalisation

Anecdote 2 : Industrialiser l'enrichissement LLM multi-fournisseurs chez ACCENSEO

Chez ACCENSEO, l'un des chantiers récurrents avec mes clients e-commerce et PIM, c'est l'enrichissement massif de fiches produits par IA : des dizaines de milliers de fiches à optimiser - taxonomie automatique, rewriting SEO de descriptions, amélioration photo (détourage, fonds, watermark), génération de modèles 3D, traduction multilingue, extraction d'attributs depuis les visuels. Le piège : si on s'enferme sur un seul fournisseur LLM, on subit ses pannes, ses prix et ses limites de débit.

J'ai bâti un pipeline multi-fournisseur par défaut. Côté texte, j'ai intégré OpenAI GPT, Anthropic Claude et Google Gemini avec un routeur qui choisit le modèle selon la tâche (Claude pour la précision, GPT pour la créativité, Gemini pour le multimodal léger). Côté 3D, j'ai branché TRELLIS, TripoSR et Shap-E pour générer des modèles 3D à partir des photos produits. Côté image, traitement automatique du fond, détourage et watermark.

Enrichissement déployé à l'échelle sur les plateformes e-commerce de plusieurs clients (immobilier, mode, viticulture, automobile, cuisine équipée), lift qualité catalogue mesurable sans coût linéaire en humains - et un produit interne Addly dérivé de cette expertise pour Confluence/Atlassian Forge.

Sur ce chantier j'ai compris que l'IA générative en production se gagne sur la discipline d'observabilité (token cost, latence, taux d'hallucination détectés) et sur la stratégie multi-fournisseur, pas sur la sophistication du prompt. C'est l'angle que je veux pousser sur le prochain rôle CTO scale-up : transformer l'IA en moat, pas en gadget de démo.

Voir la réalisation

Réalisation

Anecdote 3 : Pipeline ETL Akeneo vers les portails immobiliers (Ligneurs)

Pendant 4 ans chez Pichet (2019-2023), j'ai été référent technique du pipeline d'export Ligneurs - le moteur de diffusion automatisée des annonces immobilières du groupe vers une vingtaine de portails partenaires (SeLoger, LeBonCoin, BienIci, LogicImmo...). Sur ce périmètre, j'ai travaillé en binôme avec Thomas R. sur les pans techniques principaux et coordonné les référents métier (Gaetan B., Leslie A.) et le prestataire externe sur les déploiements. Le système alimentait un volume estimé à un lead toutes les 2 secondes sur l'ensemble des portails. Toute interruption se traduisait directement en leads perdus et en chiffre d'affaires manqué.

Avec Thomas R., on a posé une architecture modulaire par partenaire plutôt qu'un moteur générique : un conteneur Docker isolé par portail, orchestré par Kubernetes sur AWS EKS, avec GitLab CI pour des déploiements ciblés sans impacter les autres flux. Côté ETL, le pipeline extrait via API REST PIM Akeneo v2, transforme au format spécifique de chaque portail (XML, CSV, JSON), pré-rend les images en multi-format centralisé (4/3, 16/9, panoramique, carré) pour éviter le retraitement par partenaire, et livre par FTP/SFTP automatisé. J'ai ensuite ajouté des patterns défensifs sur les sources hétérogènes : circuit breaker sur l'API PIM, logique de retry sur les uploads FTP, algorithme de matching SKU entre les programmes manuels et les programmes ERP. La migration v1.4 → v2 a été menée portail par portail avec validation métier à chaque étape (référents Gaetan B. et Leslie A.), jamais en big-bang.

Migration zéro-downtime sur tous les portails partenaires, monitoring centralisé avec alertes email automatisées, et le pipeline a tourné en exploitation continue pendant 4 ans sans perte d'annonce majeure - aucun équivalent ne tournait dans le département avec ce niveau de fiabilité.

Ce projet a élevé le standard data engineering que je porte sur chaque mission ACCENSEO : isolation par partenaire, traitement batch quand le streaming temps réel n'apporte rien, observabilité par flux dès la conception. C'est aussi sur ce projet que j'ai durablement compris la dette d'architecture data : un module unique générique semble simple à l'écriture mais devient ingérable à la dixième intégration partenaire.

Voir la réalisation

Mon autocritique

Niveau Expert (7/10, score 4.1/5) avec cible 8/10 sur les deux prochaines années - approfondissement, pas changement de tier. Fondations solides : workflows LLM agentiques multi-fournisseurs (Claude, GPT, Gemini, Google Vertex avec routing par tâche), RAG hands-on avec contextual retrieval + BM25 + reranker dans le pipeline ACCENSEO, embeddings et vector search via pgvector sur PostgreSQL, modélisation type-safe Prisma (~91 modèles SaaS comptable, 98 SaaS courtiers), MongoDB et PostgreSQL en production sur centaines de Go côté ACCENSEO, fondamentaux ML sur Azure ML Studio (AdsPower 2016-2018), SQL avancé comme socle.

Ce qui reste à muscler à l'horizon 2026-2028 - là où le marché vient juste de basculer : orchestration multi-agents en essaims (rôles définis, mémoire partagée, observabilité commune façon LangChain agentic engineering), spec-driven development comme contrat formel humain ↔ agent, infrastructure d'évaluation continue (LangSmith, Langfuse, LLM-as-judge à grande échelle, counterfactual testing), GraphRAG et late-interaction retrieval sur connaissances métier régulées, MLOps grade production (model registry, drift detection, A/B test sur prompts, prompt-as-code versioning), AI Act audit trail intégré dès la conception, FinOps de l'IA (cost per feature, budget par agent, latence vs qualité), streaming RAG sur ingestion continue.

Axe #1 de mon projet 2026-2028. C'est ce qui distingue un CTO « opérateur de stack moderne » d'un CTO agent-native capable de cadrer un produit IA-augmenté, sourcer une équipe data + ML / LLM cohérente et défendre une roadmap IA devant un board en distinguant ce qui est moat de ce qui est commodity. Sur un SaaS B2B vertical régulé, cette compétence conditionne trois leviers business : vélocité produit (cycles spec → prod compressés), coût d'exploitation (FinOps de l'IA) et conformité AI Act dès la conception. Sans cet axe, le rôle CTO 2026-2028 se réduit à un rôle d'opérateur stack moderne.

Axe #1 du projet 2026-2028 : passer d'un CTO « opérateur de stack moderne » à un CTO agent-native, défendant une roadmap IA devant un board sur la vélocité produit, le FinOps de l'IA et la conformité AI Act, en distinguant moat de commodity — Jose DA COSTA

Consolidation Expert (7→8/10) déclenchée fin 2024, mesurable trimestre par trimestre : un livrable IA en production par trimestre, intake hebdomadaire des releases modèles, rétrospective mensuelle « ce qui marche en prod vs ce qui a échoué ». Je n'avance pas par sprint d'urgence : je reste aligné avec la trajectoire, sans dette d'apprentissage à rattraper.

À moi-même : eval écrite avant le code sur tout chantier IA, prompt registry qui versionne chaque prompt, le rejoue sur datasets d'éval, compare les variantes côte-à-côte et trace leur évolution (avec un journal explicite de ce qui marche, de ce qui rate et pourquoi), zéro tolérance pour la dette de prompt non testée, et progression continue sur les benchmarks FinOps LLM (cost per feature, cost per agent, routing inter-modèles) - orchestrer plusieurs LLM dans un même produit ne s'improvise pas.

Aux autres : ne pas confondre démo IA et production IA. En 2026, un seul LLM ne suffit plus : il faut choisir le bon modèle pour le bon usage au bon moment, et il est courant de devoir chaîner plusieurs LLM dans une même requête pour des étapes complètement différentes mais complémentaires (extraction structurée avec l'un, raisonnement avec un autre, synthèse multimodale avec un troisième). Cette orchestration multi-modèles complexifie l'usage mais devient le vrai différenciateur. Avant de choisir un modèle, investir dans la traçabilité AI Act, les garde-fous d'exécution (sanitization, rate limit, fallback humain) et le FinOps de l'IA (cost per feature, budget par agent). Choisir une stack data-first avant la stack modèle - en 2026, le moat est dans le contexte qu'on donne aux agents, jamais dans le LLM choisi.

Mon évolution dans cette compétence

L'axe stratégique 2026-2028

La data et l'IA sont l'axe qui porte mon prochain rôle CTO. Dans les deux ans à venir, je veux le décliner sur un terrain concret : prendre la responsabilité produit d'un SaaS B2B vertical IA-augmenté dès la prise de poste, recruter une première équipe data + ML / LLM de 3 à 5 personnes en 18 mois, poser la couche RAG industrialisée et l'eval continue dans les 90 premiers jours du run, et tenir 4 cycles trimestriels successifs de présentation roadmap IA au board avec métriques produit / coûts / conformité.

D'ici fin 2027, l'objectif observable est d'opérer une plateforme data + IA grade production avec pipeline RAG industrialisé (eval + drift detection), une plateforme d'observation des coûts LLM et de versionning des prompts (cost per feature, cost per agent, prompt registry qui trace l'évolution des prompts dans le temps et permet de comparer leurs variantes sur des datasets d'éval), un coût explicite par feature IA et une revue trimestrielle de la qualité. Le passage de 7/10 à 8/10 (consolidation du tier Expert) se mesure sur la triple maîtrise data engineering + ML appliqué + LLM-Ops + agentic dev, pas sur un score abstrait.

Plateforme data + IA grade production fin 2027 : pipeline RAG industrialisé (eval, drift detection), observatoire des coûts LLM (cost per feature, cost per agent), prompt registry versionné comparé sur datasets d'éval, revue trimestrielle Q1-Q4 et passage Expert 7/10 → 8/10 sur la triple maîtrise data engineering, ML appliqué, LLM-Ops + agentic dev — Jose DA COSTA

RAG hands-on intégré au pipeline ACCENSEO, intake hebdomadaire des releases LLM. Master Expert en Ingénierie du Logiciel actif jusqu'en 2026.

Cohortes prioritaires 2026 : AI Evals For Engineers & PMs (Hamel Husain & Shreya Shankar sur Maven, cohorte août 2026) pour l'eval LLM-as-judge en production, Agentic AI sur DeepLearning.AI pour les patterns multi-agents et MCP. Certifications visées 2026-2027 : NVIDIA Agentic AI LLMs Professional (architecture multi-agents, orchestration, gouvernance), AWS Certified Generative AI Developer Professional (RAG production sur Bedrock). GCP Professional Data Engineer envisagée selon le contexte cible scale-up.

Lectures piliers, organisées par thème :

LLM-Ops et applications production : AI Engineering (Chip Huyen, O'Reilly 2025), Designing Machine Learning Systems (Chip Huyen, O'Reilly), LLM Engineer's Handbook (Iusztin & Labonne, Packt 2024) sur le triptyque RAG + fine-tuning + LLMOps, Building LLM Powered Applications (Valentina Alto, Packt).

Fondamentaux et internals : Hands-On Large Language Models (Alammar & Grootendorst, O'Reilly 2024) pour la compréhension visuelle, Build a Large Language Model (From Scratch) (Raschka, Manning 2024) pour les internals.

Context engineering et data : Prompt Engineering for LLMs (Berryman & Ziegler, O'Reilly 2024), Fundamentals of Data Engineering (Reis & Housley, O'Reilly 2022) pour le socle.

Références francophones : Ingénierie de l'IA (Chip Huyen, First Interactive — traduction française de AI Engineering pour la lecture en VO comme en VF) et Introduction au Machine Learning (3e éd.) (Chloé-Agathe Azencott, Dunod 2025), manuel universitaire signé Mines Paris-PSL pour la rigueur scientifique.

Veille continue : papers sélectionnés sur arXiv, Latent Space, Eugene Yan, Simon Willison, Hamel Husain. Routine mensuelle : un nouveau modèle évalué sur un cas réel.