Analyse détaillée du prompt FinOps pour Claude Code
Vue d'ensemble : qu'est-ce que ce prompt ?
Ce prompt n'est pas une question ou une commande simple. C'est une directive de rôle complète (system prompt) qui transforme Claude Code en ingénieur FinOps spécialisé IA. Il définit :
- Une identité professionnelle (ingénieur FinOps)
- Une mission précise (audit + plan d'optimisation)
- Une méthodologie imposée (6 phases séquentielles)
- Des contraintes éthiques (garde-fous techniques et professionnels)
- Un format de livrable attendu
C'est l'équivalent d'un cahier des charges de mission de conseil, encodé en prompt.
Anatomie du prompt — décomposition section par section
Section 1 : « Rôle et mission »
Tu es un ingénieur FinOps spécialisé dans les systèmes d'IA générative en production.
Ta mission : auditer ce dépôt et l'usage associé, quantifier les postes de coût...
Ce que ça fait techniquement :
- Active un mode mental spécifique chez Claude (terminologie, raisonnement métier, références normatives)
- Définit le scope : production (pas POC, pas R&D)
- Fixe le livrable attendu : audit + plan chiffré + priorisé
- Pose la contrainte non-négociable : « sans dégrader la qualité ni la latence »
Pourquoi c'est important : Sans ce cadrage, Claude pourrait par défaut :
- Donner des conseils génériques
- Modifier le code sans permission (Claude Code peut écrire)
- Optimiser à l'aveugle (réduire
max_tokenspartout, casser la qualité)
Section 2 : Le temps strictement séparés — le garde-fou n°1
1. Audit (lecture seule) : tu explores, tu mesures, tu rédiges un rapport. Tu ne modifies rien.
2. Implémentation (sur validation) : tu n'appliques un changement qu'après que je l'ai approuvé.
Le problème qu'il résout :
Claude Code a accès à un terminal et peut écrire des fichiers, commiter, installer des dépendances. C'est puissant mais dangereux dans une mission d'audit. Sans cette séparation explicite :
- Claude pourrait modifier le code en croyant "aider"
- Casser un environnement de production
- Installer des dépendances non validées
- Faire des commits parasites
Le pattern utilisé est emprunté à la gouvernance IT : « measure twice, cut once ». En audit Sarbanes-Oxley, ISO 27001, ou ANSSI, on sépare toujours :
- L'observation (collecte de preuves, lecture seule)
- La recommandation (rapport)
- L'action (mise en œuvre validée)
Section 3 : La méthode imposée — 6 phases ordonnées
C'est le cœur opérationnel du prompt. Chaque phase a un but précis :
| Phase | Nom | But | Pourquoi cet ordre |
|---|---|---|---|
| 1 | Découverte | Cartographier sans interpréter | Voir avant de juger |
| 2 | Baseline | Mesurer l'existant | Pas d'optimisation sans référence |
| 3 | Pareto 20/80 | Identifier l'impact | Concentrer l'effort |
| 4 | Quantification | Estimer chaque levier | Comparer les options |
| 5 | Priorisation | Trier par ROI | Séquencer le travail |
| 6 | Livrable | Synthèse + plan | Rendre actionnable |
La règle d'or énoncée : « N'optimise jamais avant d'avoir mesuré. »
C'est un principe anti-cargo cult : il interdit les recommandations génériques type « utilisez le batching » sans avoir prouvé que ça aide dans ce contexte précis.
Section 4 : Les 11 leviers de la checklist
Ce sont les gisements connus d'économies sur un système LLM en production. Le prompt force Claude à examiner chacun, ce qui empêche d'oublier des leviers évidents :
| # | Levier | Gain typique | Effort |
|---|---|---|---|
| 1 | Routage modèles (gros↔petit) | 30-70% | Moyen |
| 2 | Réduction tokens d'entrée | 10-40% | Faible |
| 3 | Prompt caching | 50-90% sur préfixes stables | Faible |
| 4 | Réduction tokens de sortie | 10-30% | Très faible |
| 5 | Batch API (async) | ~50% | Faible |
| 6 | Cache applicatif (exact/sémantique) | 20-80% selon redondance | Moyen |
| 7 | RAG optimisé (reranking, filtres) | 30-60% | Moyen |
| 8 | Limites orchestration agentique | 20-50% | Moyen |
| 9 | Observabilité FinOps | Indirect (active les autres) | Élevé |
| 10 | Infrastructure (quantization, batching GPU) | 30-70% | Élevé |
| 11 | Tarifs/contrats | 10-30% | Variable |
Cette liste est exhaustive et issue de l'état de l'art FinOps LLM (FinOps Foundation, papers Anthropic/OpenAI, retours d'expérience prod). Elle évite les angles morts.
Section 5 : Les garde-fous — l'éthique du conseil
- Ne dégrade jamais la qualité ni la latence de façon silencieuse.
- Ne fabrique aucun chiffre. Une estimation est étiquetée comme telle, avec ses hypothèses.
- Phase d'audit en lecture seule. Aucune écriture, aucun commit, aucune installation.
- Pour chaque économie, propose une mesure de contrôle avant / après.
- Si une donnée manque, dis-le et propose comment l'obtenir.
Décodage de chaque garde-fou :
a) « Ne dégrade jamais la qualité de façon silencieuse »
Tout arbitrage qualité/coût doit être explicite et chiffré.
Pourquoi : un LLM peut techniquement répondre 5× moins cher en passant de Claude Opus à Phi-3, mais si le taux d'hallucination triple, vous perdez plus en SAV qu'en coûts évités. Le prompt force à toujours quantifier le compromis.
b) « Ne fabrique aucun chiffre »
Une estimation est étiquetée comme telle, avec ses hypothèses.
C'est la lutte contre l'hallucination chiffrée — le travers typique des LLM consultants qui inventent « cette optimisation économisera 35% » sans base. Le prompt impose la transparence épistémique : mesuré, estimé, ou inconnu.
c) « Phase d'audit en lecture seule »
Cité plus haut — protège l'environnement.
d) « Mesure de contrôle avant/après »
Sinon le gain n'est pas démontrable.
Principe scientifique : pas de validation = pas de gain. C'est ce qui sépare le FinOps réel de l'optimisation à l'aveugle.
e) « Si une donnée manque, dis-le »
Ne comble pas le vide.
Anti-confabulation. Plutôt que d'inventer des volumétries plausibles, Claude doit proposer l'instrumentation qui permettra de les mesurer.
Le but réel : pourquoi ce prompt existe-t-il ?
Problème business sous-jacent
Les coûts LLM en production explosent silencieusement. Les organisations découvrent typiquement après 3-12 mois :
- Une facture API qui a doublé sans hausse de trafic correspondante
- Des system prompts surdimensionnés par accumulation historique
- Des modèles top-tier utilisés pour des tâches triviales
- Zéro observabilité sur la décomposition des coûts
- Des boucles agentiques qui consomment 20× plus que prévu
Sans méthode rigoureuse, on optimise au doigt mouillé et on dégrade la qualité.
Objectifs du prompt
- Forcer la rigueur méthodologique — pas de raccourci, pas de phase sautée
- Produire un livrable réutilisable — un rapport Markdown structuré, partageable avec une DAF/CISO
- Protéger l'environnement audité — séparation stricte lecture/écriture
- Quantifier l'incertitude — distinguer mesure et estimation
- Rendre les gains démontrables — chaque optimisation a son protocole de validation
C'est, en somme, la transposition d'une mission de conseil senior en prompt exécutable.
Je confirme ma compréhension totale du mandat, des enjeux techniques, légaux et financiers. Le rôle combiné d'Ingénieur Senior FinOps + Délégué à la Protection des Données (DPO) Technique me place au carrefour de l'optimisation opérationnelle responsable : garantir que chaque dollar économisé ne dégrade en aucun cas le niveau de conformité, ni l'expérience utilisateur.
Je m'engage à respecter les Garde-fous absolus énoncés, notamment le principe de la traçabilité des arbitrages (Cost $\leftrightarrow$ Risk) et le statut de lecture seule jusqu'à validation explicite. Le rapport sera fondé sur la méthodologie stricte en 6 phases.
Les limites — ce que ce prompt ne peut PAS faire
Limite 1 : il dépend de la qualité du repo audité
Cas idéal :
- Code instrumenté (logs tokens, latence)
- Dashboards d'usage existants
- Documentation à jour
- Conventions claires dans le code
Cas dégradé (le plus fréquent) :
- Aucune métrique
- Code spaghetti, appels LLM cachés dans des helpers
- Configurations dispersées
- Pas de différenciation dev/staging/prod
Dans le cas dégradé, la Phase 2 (baseline) sera majoritairement "Inconnu" et le prompt produira surtout une liste d'instrumentations à mettre en place, pas des chiffres. C'est attendu et c'est honnête, mais ça peut décevoir si l'on attendait un gain chiffré immédiat.
Limite 2 : Claude ne voit pas les coûts réels
Sauf si vous lui fournissez :
- Les exports de facturation Anthropic / OpenAI / OVH
- Les dashboards Grafana
- Les logs Loki/Prometheus
- Les compteurs de tokens
…Claude estimera à partir du code visible, ce qui produit des fourchettes larges. Plus vous nourrissez l'audit en données réelles, plus les chiffres sont fiables.
Limite 3 : la qualité métier n'est pas mesurée par Claude
Le prompt parle de « sans dégrader la qualité » — mais Claude ne peut pas tester votre qualité métier. Il ne sait pas :
- Si vos utilisateurs tolèrent une réponse 200ms plus lente
- Si votre cas d'usage médical exige 99,9% de précision
- Quel taux d'hallucination est acceptable pour votre RAG juridique
Vous devez fournir ces SLAs ou Claude raisonnera en généralités.
Limite 4 : pas d'analyse contractuelle
Le levier 11 (tarification, contrats) mentionne « paliers tarifaires, engagements de volume » — mais Claude n'a pas accès à :
- Vos contrats négociés avec Anthropic/OpenAI/AWS
- Vos engagements de Reserved Instances
- Vos remises confidentielles
Il peut recommander d'aller négocier, mais pas chiffrer les marges réelles.
Limite 5 : connaissance des tarifs datée
Le prompt anticipe cette limite :
« Vérifie les tarifs et les remises en cours sur la documentation officielle du fournisseur plutôt que de te fier à des prix mémorisés (ils changent). »
Les prix LLM bougent tous les 3-6 mois. Sans accès web, Claude utilise ses connaissances figées (potentiellement obsolètes de 6-18 mois). En production : toujours croiser avec les pages tarifaires officielles au moment de l'audit.
Limite 6 : la Phase 6 reste un brouillon
Le rapport final produit est un point de départ, pas un livrable signé :
- Les chiffres demandent validation humaine
- Les risques qualité demandent du test métier
- Le plan d'action demande arbitrage budgétaire/RH
- La synthèse exécutive demande personnalisation au contexte client
Claude produit un draft à 80%. Les 20% restants (validation, contexte business, ton) restent humains.
Limite 7 : pas de magie sur le coût caché des optimisations
Certaines optimisations recommandées (quantization, fine-tuning, distillation) ont un coût d'implémentation et de maintenance que le prompt sous-estime parfois :
- Quantization → tests qualité poussés, perte parfois irrécupérable
- Fine-tuning → coût d'entraînement, dérive dans le temps, MLOps complet
- Distillation → infrastructure d'entraînement, équipe ML
Le prompt demande de chiffrer l'effort, mais Claude tend à minimiser ces coûts cachés. À pondérer avec une équipe MLOps réelle.
Forces du prompt — pourquoi il marche bien
1. Séparation stricte observation / action
Pattern emprunté à l'audit financier, robuste et éprouvé.
2. Vocabulaire technique précis
Les termes (Pareto, baseline, quick wins, quantization, speculative decoding, AWQ/GPTQ, top_k, reranking) activent les bons modèles mentaux chez Claude. Ce n'est pas du jargon décoratif.
3. Anti-hallucination intégré
Le tag « mesuré / estimé » + niveaux de confiance + interdiction d'inventer = qualité épistémique élevée.
4. Livrable structuré
Le format imposé (synthèse, baseline, constats, tableau de recommandations, plan d'action) garantit la cohérence quelle que soit la complexité du système audité.
5. Universalité
Le prompt fonctionne aussi bien pour :
- Un RAG simple (FastAPI + Ollama)
- Un agent LangChain multi-tools
- Une infrastructure auto-hébergée vLLM
- Un produit SaaS sur Anthropic API
…parce qu'il ne présuppose pas l'architecture, il s'y adapte par la phase de découverte.
Quand utiliser ce prompt
✅ Cas idéaux
- Système LLM en prod depuis au moins 3 mois (vous avez des données)
- Facture qui inquiète la direction
- Souhait de pérenniser un produit IA (passer de POC à industrialisation)
- Audit pré-levée de fonds (montrer la maîtrise des coûts)
- Préparation à la scale (avant ×10 de trafic)
⚠️ Cas où il est inadapté
- POC en cours de validation — trop tôt, focus sur le produit
- Système au repos — pas de données à analyser
- Pure recherche — l'optimisation coût n'est pas la priorité
- MVP < 1 mois — pas encore de baseline significative
🔄 Cas intermédiaires
- Migration en cours (ex: passage d'OpenAI vers Claude) — utile mais demandera des phases supplémentaires
- Architecture hybride (multi-cloud, multi-provider) — possible mais prévoir plus de temps
Conseils d'utilisation avancée
Avant de lancer le prompt
-
Préparez les artefacts :
- Export de facturation 3 derniers mois
- Liste des features qui utilisent du LLM
- SLAs en vigueur (latence acceptable, qualité minimum)
- Logs si disponibles (Grafana, Loki, OpenTelemetry)
-
Définissez le scope :
- Tout le système ? Une feature précise ?
- Audit interne ou pré-audit externe ?
- Budget temps : 1 jour, 1 semaine, 1 mois ?
-
Choisissez l'outil :
- Claude Code (terminal, accès filesystem) : audit complet sur repo entier
- Claude.ai (web) : extraits de code + analyse plus interactive
- API directe : pour intégrer dans un pipeline CI/CD d'audit automatisé
Pendant l'audit
- Ne sautez pas la Phase 2 même si vous êtes pressé — un audit sans baseline est inutile
- Challenge les estimations — demandez « sur quelle hypothèse repose ce chiffre ? »
- Demandez des alternatives — « et si on ne touche pas au modèle, quels leviers ? »
Après l'audit
- Validez 1-2 quick wins en pilote avant de tout déployer
- Mesurez 2 semaines avant et après chaque optimisation
- Re-auditez tous les 6 mois — les coûts dérivent silencieusement
Synthèse en une phrase
Ce prompt transforme Claude Code en ingénieur FinOps senior qui mène un audit méthodique, prudent et chiffré d'un système LLM en production, en respectant des garde-fous stricts (lecture seule, anti-hallucination, mesures avant/après), pour produire un plan d'optimisation actionnable dont les gains seront démontrables — à condition d'être nourri en données réelles et exécuté avec discipline.
Pour aller plus loin
Si vous voulez adapter ce prompt à votre contexte spécifique, les leviers d'évolution sont :
- Ajouter votre stack technique au début (« notre architecture utilise X, Y, Z ») pour des analyses plus ciblées
- Préciser vos SLAs (latence max, qualité min) pour cadrer les arbitrages
- Fournir vos contraintes RGPD/souveraineté pour orienter les recommandations infra
- Limiter à certaines phases (ex: « uniquement Phases 1+2+3 ») si vous voulez démarrer petit
- Ajouter des leviers métier-spécifiques (ex: pour healthcare, ajouter HIPAA compliance check)
Prompt FinOps Avancé pour Ollama + Gemma4 avec RGPD
Voici un prompt enrichi et adapté à votre contexte (Ollama auto-hébergé, Gemma4, conformité RGPD/ANSSI). Il étend le prompt original avec :
- ✅ Spécificités Ollama / Gemma4 / vLLM (quantization, GPU, batching local)
- ✅ Volet RGPD complet (DPIA, minimisation, transferts, droits des personnes)
- ✅ Conformité ANSSI / CNIL (souveraineté, hébergement, journalisation)
- ✅ Compatibilité AI Act (gouvernance, classification du risque)
- ✅ Considérations sécurité (prompt injection, exfiltration, secrets)
---## ✅ Trois prompts créés, adaptés à votre contexte
J'ai conçu 3 versions complémentaires pour couvrir vos différents besoins :
📄 1. prompt-finops-rgpd-ollama-gemma4.md — Version complète (recommandée)
~10 pages, conçue spécifiquement pour votre stack et la conformité européenne.
Nouveautés majeures vs prompt original :
🔷 8 phases au lieu de 6 :
- Ajout d'une Phase 2 dédiée RGPD (cartographie données, bases légales, AI Act)
- Ajout d'une Phase 7 Plan d'action détaillé avec validation DPO
- Phase 8 livrable structuré avec annexes
🔷 Spécificités Ollama natives :
- Paramètres précis (
num_predict,num_ctx,OLLAMA_KEEP_ALIVE,OLLAMA_NUM_PARALLEL) - Quantization Gemma4 (Q4_K_M / Q5_K_M / Q8_0 / FP16)
- Comparaison Ollama vs vLLM vs TGI pour production lourde
- KV cache, continuous batching, speculative decoding
🔷 Volet RGPD complet :
- Inventaire des traitements (catégories, bases légales art. 6, finalités)
- Données sensibles (art. 9), mineurs (art. 8), données pénales (art. 10)
- Droits des personnes (export, oubli, portabilité art. 15-22)
- DPIA/AIPD si requise
- Registre des traitements (art. 30)
🔷 AI Act 2024/1689 :
- Classification du risque (inacceptable / élevé / limité / minimal)
- Obligations GPAI pour Gemma4
- Surveillance humaine (art. 14), transparence (art. 13)
- Documentation technique annexe IV
🔷 Conformité française/européenne :
- ANSSI / CNIL / SecNumCloud / HDS
- OWASP Top 10 for LLM (sécurité)
- ISO/IEC 42001 (système management IA)
- MITRE ATLAS (adversarial ML)
🔷 18 leviers au lieu de 11 :
- 11 leviers techniques (héritage + adaptations Ollama)
- 7 leviers RGPD/conformité spécifiques (minimisation, pseudonymisation, souveraineté, etc.)
🔷 13 garde-fous au lieu de 5 :
- Techniques (lecture seule, anti-hallucination, mesures avant/après)
- RGPD (DPO impliqué, pas de régression conformité, documentation)
- Sécurité (pas de divulgation secrets, anti-exfiltration, vigilance prompt injection)
⚡ 2. prompt-finops-rgpd-express.md — Version condensée
~1,5 page, pour audits récurrents ou systèmes déjà conformes au premier niveau.
Couvre l'essentiel : 6 phases, RGPD intégré, garde-fous synthétisés. Démarrage rapide.
📊 3. COMPARAISON-prompts-finops.md — Guide de choix
Aide à décider quelle version utiliser selon :
- Le secteur (santé, finance, public, PME)
- La maturité du système
- Le contexte (premier audit, re-audit, certification)
- Les contraintes (HDS, SecNumCloud, DORA, NIS2)
Inclut des personnalisations sectorielles prêtes à coller pour santé / finance / public / PME.
Recommandation pour vos cas d'usage
Pour vos projets (UGAIA, GRCA100, conseil clients souverains européens) : utilisez le prompt complet RGPD. Il correspond à votre positionnement et produit un livrable de qualité audit, utilisable comme :
- Pièce d'audit interne
- Base pour une DPIA / AIPD
- Document préparatoire à audit CNIL
- Référence pour certification ISO 42001
- Annexe technique AI Act (annexe IV pour systèmes à risque élevé)
Intégration avec vos scripts existants
Vous pouvez substituer ces prompts dans :
PowerShell (Audit-FinOps.ps1, fonction Get-PhasePrompt) :
# Remplacer le contenu de la phase 2 par le bloc RGPD complet
$prompts[2] = Get-Content "prompt-finops-rgpd-ollama-gemma4.md" -Raw
Python (audit_finops_complete.py, dict PHASE_PROMPTS) :
# Charger le prompt depuis le fichier
with open("prompt-finops-rgpd-ollama-gemma4.md") as f:
PHASE_PROMPTS[2] = f.read()
Approche hybride recommandée pour souveraineté maximale
Pour vos clients en secteurs sensibles :
| Phase | Outil | Justification |
|---|---|---|
| Phase 1 (Découverte) | Ollama/Gemma4 local | Pas de fuite du code |
| Phase 2 (RGPD) | Claude (anonymisé) | Raisonnement juridique complexe |
| Phase 3 (Baseline) | Local | Données chiffrées sensibles |
| Phase 4-5 (Pareto, Leviers) | Claude | Synthèse multi-critères |
| Phase 6-8 (Plan, Livrable) | Claude + revue humaine | Qualité rédactionnelle |
Cette approche maintient la souveraineté sur les données tout en bénéficiant de la qualité d'analyse de Claude pour les phases interprétatives.
Comparaison des prompts FinOps disponibles
Vue d'ensemble des 3 versions
| Aspect | Prompt original | Express RGPD | Complet RGPD |
|---|---|---|---|
| Longueur | ~2 pages | 1,5 page | ~10 pages |
| Public | Tech generic | Tech + DPO | Tech + DPO + Juridique + Direction |
| Phases | 6 | 6 | 8 |
| Garde-fous | 5 techniques | 8 (techniques + RGPD) | 13 (tech + RGPD + sécurité) |
| Leviers | 11 techniques | 11 tech + 6 RGPD | 11 tech + 7 RGPD |
| Conformité | Aucune | RGPD + AI Act | RGPD + AI Act + ANSSI + CNIL + ISO + OWASP |
| Durée audit | 1-2 jours | 2-3 jours | 1-2 semaines |
| Livrable | Rapport Markdown | Rapport Markdown structuré | Rapport + Annexes + Registre |
Quand utiliser quelle version ?
🚀 Prompt original (générique)
Idéal pour :
- Audit rapide d'un système LLM non-européen
- POC ou MVP en phase exploration
- Système utilisant des APIs externes (Claude, OpenAI) sans contraintes RGPD strictes
- Première sensibilisation FinOps
Limitations :
- Aucune analyse RGPD
- Ne prend pas en compte Ollama spécifiquement
- Ne traite pas la souveraineté
Prompt Express RGPD
Idéal pour :
- Audit hebdomadaire ou mensuel d'un système en production
- Re-audit après implémentation de recommandations précédentes
- Équipe technique avec DPO disponible
- Système Ollama/Gemma4 déjà conforme à un premier niveau
Avantages :
- Concis mais complet sur l'essentiel
- Phases RGPD intégrées sans alourdir
- Démarrage rapide
Limitations :
- Pas adapté pour un premier audit complet
- Annexes et documentation moins détaillées
- Pour systèmes secteurs critiques, préférer la version complète
Prompt Complet RGPD (recommandé)
Idéal pour :
- Premier audit complet d'un système d'IA générative en production
- Secteurs régulés (santé, finance, RH, éducation, justice)
- Système avec traitement de données personnelles ou sensibles
- Préparation à audit externe (CNIL, certification ISO 42001)
- Documentation pré-mise en conformité AI Act (échéances 2025-2027)
- Vos projets : UGAIA, GRCA100, conseil clients souverains
Avantages :
- Couverture exhaustive
- 8 phases incluant cartographie RGPD complète
- Garde-fous renforcés (13 contraintes)
- Compatible exigences ISO 42001, SecNumCloud, HDS
- Livrable utilisable comme pièce d'audit ou base de DPIA
Limitations :
- Long à exécuter (1-2 semaines pour audit complet)
- Demande des informations contextuelles à fournir
- Nécessite collaboration DPO + équipe technique
Adaptation au contexte UGAIA.
Pour votre stack spécifique (Ollama + Open WebUI + LiteLLM + Presidio + Redis + Loki + Grafana sur OVHcloud bare-metal), le prompt complet RGPD est le plus pertinent car il :
- Reconnaît Ollama nativement (paramètres, KV cache, OLLAMA_KEEP_ALIVE)
- Intègre Presidio dans la phase RGPD (anonymisation pré-LLM)
- Évalue OVHcloud comme cloud souverain (positif RGPD)
- Évalue LiteLLM pour ses télémétries éventuelles
- Couvre Loki/Grafana dans l'observabilité FinOps + audit
- Mappe sur AI Act pour secteurs régulés européens
Si vos clients sont en santé, finance ou public sector, le prompt complet est non-négociable pour produire un livrable de qualité audit.
Personnalisations possibles
Pour secteur santé
Ajoutez en préambule :
Contraintes spécifiques :
- Hébergement HDS (Hébergeur Données de Santé) requis
- Référentiels ASIP Santé, HAS, MEDDIC
- Patient data ne quitte JAMAIS le périmètre HDS
- Loi Informatique et Libertés + RGPD + Code de la santé publique
Pour secteur finance
Ajoutez :
Contraintes spécifiques :
- ACPR/EBA Guidelines on outsourcing
- DORA (Digital Operational Resilience Act)
- Cloud Act US à exclure (souveraineté)
- Continuité d'activité critique
Pour secteur public
Ajoutez :
Contraintes spécifiques :
- Référentiel SecNumCloud (ANSSI)
- RGS (Référentiel Général de Sécurité)
- Marchés publics : code de la commande publique
- Décret 2021-1361 — souveraineté
Pour TPE/PME
Allégez :
Adaptations PME :
- Pas de DPO obligatoire (mais référent désigné)
- AIPD simplifiée si traitement à risque modéré
- Documentation proportionnée à la taille
- Focus sur quick wins implémentables sans MLOps dédié
Comment utiliser ces prompts
Avec Claude Code (recommandé)
# 1. Copier le prompt dans le contexte de Claude Code
# 2. Pointer vers votre repo
# 3. Laisser Claude exécuter les phases
# 4. Récupérer le rapport généré
Avec Claude.ai (web)
1. Coller le prompt complet
2. Uploader le repo en .zip
3. Demander "exécute la Phase 1"
4. Itérer phase par phase
Avec Ollama / Gemma4 local
# Via le script PowerShell que vous avez
.\Audit-FinOps.ps1 -Command Audit -RepoPath . -Model gemma4
# Le script utilise déjà un dérivé de ce prompt
# Vous pouvez modifier Get-PhasePrompt pour injecter ces versions
Hybride (recommandé pour qualité maximale)
- Découverte technique (Phase 1) : Ollama/Gemma4 local — pas de fuite de données
- Cartographie RGPD (Phase 2) : Claude (claude.ai) sur exemples anonymisés
- Baseline (Phase 3) : Local
- Pareto + Quantification (Phases 4-5) : Claude (raisonnement complexe)
- Plan d'action (Phases 6-8) : Claude + revue humaine
Cette approche respecte la souveraineté sur les données sensibles tout en bénéficiant de la qualité d'analyse de Claude pour les phases d'interprétation.
Liens entre les fichiers
prompt-finops-original.txt ← Votre prompt initial
↓
prompt-finops-rgpd-express.md ← Version condensée avec RGPD
↓
prompt-finops-rgpd-ollama-gemma4.md ← Version complète production
↓
Audit-FinOps.ps1 ← Implémentation PowerShell (intègre déjà des prompts)
audit_finops_complete.py ← Implémentation Python (intègre déjà des prompts)
Vous pouvez substituer les prompts dans Get-PhasePrompt (PowerShell) ou PHASE_PROMPTS (Python) pour basculer entre versions selon le contexte client.
Checklist de choix
Posez-vous ces questions :
-
[ ] Mon système traite-t-il des données personnelles ?
→ Oui = RGPD obligatoire -
[ ] Suis-je dans un secteur régulé (santé, finance, RH, public) ?
→ Oui = Prompt complet recommandé -
[ ] Mes utilisateurs sont-ils en Europe ?
→ Oui = AI Act obligatoire (depuis août 2024) -
[ ] Mon système est-il en production avec > 1000 utilisateurs ?
→ Oui = Prompt complet pour audit sérieux -
[ ] Ai-je le temps pour un audit approfondi (1-2 semaines) ?
→ Oui = Complet, Non = Express -
[ ] Vais-je présenter ce rapport à une autorité ou un comité d'audit ?
→ Oui = Complet impératif -
[ ] Mon système utilise-t-il Ollama / un LLM auto-hébergé ?
→ Oui = Prompt Ollama/Gemma4 spécifique
Aide à la décision
| Votre situation | Prompt recommandé |
|---|---|
| Audit express d'un POC interne | Original |
| Re-audit mensuel d'un système éprouvé | Express RGPD |
| Premier audit complet | Complet RGPD |
| Préparation audit CNIL | Complet RGPD |
| Audit pour client en santé/finance | Complet RGPD + personnalisation secteur |
| Audit UGAIA / GRCA100 / projet sovereign | Complet RGPD |
| Audit pré-certification ISO 42001 | Complet RGPD + ISO mapping |
| Audit pré-investisseur (due diligence) | Complet RGPD (montre la maîtrise) |
Recommandation par défaut pour vos projets : Prompt complet RGPD Ollama/Gemma4, c'est celui qui correspond le mieux à votre positionnement (souveraineté, conformité européenne, qualité d'audit).
Ceci n'est pas un simple prompt, mais une architecture méthodologique complète et extrêmement détaillée pour réaliser des audits de conformité IA.
Le document présente en réalité un kit d'outils (3 prompts différents) destiné à transformer l'utilisation d'un modèle LLM local (Ollama/Gemma4) en un livrable professionnel, auditable, et parfaitement conforme aux lois européennes les plus récentes.
💡 Résumé Exécutif : FinOps Avancé IA & Conformité Européenne
Ce document est une réponse hautement spécialisée à l'enjeu de la confiance dans l'IA générative en Europe. Il fournit un framework d'audit qui fusionne les exigences techniques des systèmes LLM (FinOps) avec un niveau de conformité juridique et sécuritaire maximal (RGPD, AI Act, ANSSI).
🎯 Objectif Principal
Générer un document d'analyse fonctionnel et technique capable de servir de Pièce d'Audit Majeure pour la CNIL ou des certifications ISO. L'objectif est d'assurer la souveraineté des données tout en exploitant la puissance locale des modèles (Ollama, Gemma4).
🌐 Les Trois Piliers du Prompt (La Valeur Ajoutée)
Ce qui rend ce prompt avancé, c'est qu'il ne se contente pas de demander une analyse, il force le modèle à suivre un parcours rigoureux en trois dimensions simultanément :
1. Le Pilier Technique LLM (FinOps & Architecture)
Il va au-delà du simple usage d'un LLM et cible l'optimisation opérationnelle :
- Optimisation Hardware/Logiciel: Utilisation de spécificités techniques de Ollama, vLLM (exemples : quantization Q4_K_M, continuous batching) pour un déploiement efficace sur GPU locaux.
- Analyse de Performance: Gestion des ressources (KV cache,
num_ctx, etc.) nécessaires à la production réelle.
2. Le Pilier Légal (GDPR & Souveraineté)
Il intègre la législation européenne au cœur du processus d'analyse :
- Mapping Réglementaire Complet: Mise en place obligatoire de la DPIA (Analyse d’Impact sur la Protection des Données) dès le départ.
- Respect des Droits: Traitement systématique des droits des personnes concernées (droit à l'oubli, portabilité) et identification des bases légales du traitement.
- Conformité Nationale/Européenne: Prise en compte des normes strictes (ANSSI, HDS, SecNumCloud).
3. Le Pilier Sécurité & Gouvernance (AI Act & Robustesse)
Il anticipe les menaces et répond aux exigences de traçabilité :
- Conformité Future: Intégration précoce des notions du AI Act (classification du risque, obligations GPAI).
- Gestion des Risques Sécuritaires: Identification technique des failles majeures (Prompt Injection, exfiltration de secrets) et mise en place de garde-fous.
⚙️ Résumé des Versions Fournies (Le Choix selon le besoin)
| Version | Longueur / Niveau | Utilisation recommandée | Points Forts |
|---|---|---|---|
✅ Complet (prompt-finops-rgpd...) | Très long (~10 pages) | Audit officiel, Certification (ISO 42001), Premier client critique. | Couvre les 3 piliers en profondeur (Tech + RGPD + AI Act). Le choix par défaut. |
⚡ Express (prompt-finops-rgpd-express) | Condensé (~1,5 page) | Audits récurrents ou systèmes de faible risque déjà bien connus. | Gain de temps pour les vérifications rapides et le maintien en conformité. |
| 📊 Comparaison (Guide) | Document de choix | Déterminer la version idéale selon le secteur (Santé, Finance, Public) ou la maturité du système. | Aide à la décision stratégique. |
⭐️ Recommandation Clé (Le Conseil Stratégique)
- Pour la Qualité Audit Maximale : Utilisez toujours le prompt Complet RGPD. Il garantit un livrable suffisamment robuste pour être annexé à une Déclaration d’Impact ou requis par les autorités de contrôle.
- Souveraineté des Données (Approche Hybride) : Pour garantir la souveraineté totale, il est recommandé de ne pas utiliser un seul outil. On peut orchestrer l'analyse en utilisant le modèle local Ollama/Gemma4 pour les phases techniques (Découverte, Baseline) et des outils juridiques externes (comme Claude, utilisé ici comme "moteur de raisonnement juridique") pour les analyses complexes RGPD ou AI Act.
En Bref :
Ce framework transforme la simple utilisation d'un LLM en un processus industriel certifié, couvrant à la fois l'excellence technique d'opération (FinOps) et la rigueur légale européenne (RGPD/AI Act).
Audit-FinOps-v2.ps1 — Suite PowerShell v2.0
Nouveautés v2.0
Cette version 2 étend la suite v1 avec :
- 3 modes de prompt au choix : Original / Express / Complete (RGPD)
- 5 secteurs personnalisés : Generic / Healthcare / Finance / Public / SME
- 6 types d'hébergement : OnPremise / SovereignCloud / EuCloud / NonEuCloud / Hybrid / Unknown
- 2 nouvelles commandes :
Discovery(Phase 1 seule),Rgpd(Phase 2 seule),Dpia(génération template) - 8 phases en mode Complete (vs 6 en v1)
- Détection RGPD automatique dans la phase de découverte (PII patterns, télémétries externes, modèles non-UE, etc.)
- Garde-fous renforcés : DPO check, anti-régression conformité, anonymisation systématique
📋 Démarrage rapide
1. Setup
.\Audit-FinOps-v2.ps1 -Command Setup
2. Audit complet (mode recommandé)
# Pour un système soumis au RGPD (Europe)
.\Audit-FinOps-v2.ps1 -Command Audit -PromptMode Complete -Sector Generic
3. Audit sectoriel
# Santé (HDS)
.\Audit-FinOps-v2.ps1 -Command Audit -PromptMode Complete -Sector Healthcare -Hosting OnPremise
# Finance (ACPR/DORA)
.\Audit-FinOps-v2.ps1 -Command Audit -PromptMode Complete -Sector Finance -Hosting SovereignCloud
# Public (SecNumCloud)
.\Audit-FinOps-v2.ps1 -Command Audit -PromptMode Complete -Sector Public
# PME (allégé)
.\Audit-FinOps-v2.ps1 -Command Audit -PromptMode Express -Sector SME
🎯 Tableau de décision : quel mode utiliser ?
| Situation | PromptMode | Sector | Hosting |
|---|---|---|---|
| POC interne sans données perso | Original | Generic | - |
| Système prod sans RGPD strict | Original | Generic | - |
| Premier audit système prod | Complete | Generic | - |
| Re-audit mensuel système éprouvé | Express | (selon) | (selon) |
| Application santé | Complete | Healthcare | OnPremise |
| Application financière | Complete | Finance | SovereignCloud |
| Service public | Complete | Public | OnPremise |
| TPE/PME | Express | SME | (selon) |
| Audit pré-certification ISO 42001 | Complete | (selon) | (selon) |
| Préparation audit CNIL | Complete | (selon) | (selon) |
| Pré-investisseur (due diligence) | Complete | (selon) | (selon) |
🔧 Commandes détaillées
Setup
Vérification et installation des prérequis. Affiche aussi la configuration choisie.
Audit
Audit complet selon le mode choisi.
- Original : 6 phases techniques
- Express : 6 phases avec RGPD condensé
- Complete : 8 phases avec RGPD complet + AI Act
Discovery (nouveau)
Phase 1 uniquement — cartographie technique. Utile pour démarrer rapidement ou actualiser l'inventaire après un changement majeur.
.\Audit-FinOps-v2.ps1 -Command Discovery -RepoPath .
Rgpd (nouveau)
Phase 2 uniquement — cartographie RGPD/AI Act. Réservée aux modes Express et Complete.
.\Audit-FinOps-v2.ps1 -Command Rgpd -PromptMode Complete -Sector Healthcare
Dpia (nouveau)
Génère un template DPIA (Analyse d'Impact relative à la Protection des Données) basé sur le repo, structuré selon la méthodologie CNIL.
.\Audit-FinOps-v2.ps1 -Command Dpia -Sector Healthcare -DpoEmail dpo@example.com
Le template inclut :
- Contexte du traitement
- Principes fondamentaux RGPD
- Risques sur la vie privée
- Mesures à mettre en œuvre
- Validation DPO
- Annexes spécifiques IA : classification AI Act, transparence (art. 13), robustesse (art. 15), surveillance humaine (art. 14)
⚠️ Ce template doit être validé par un DPO qualifié avant utilisation officielle.
Baseline / Measure / Compare
Identiques à v1, avec ajout d'un volet RGPD dans le rapport de comparaison (checklist de non-régression).
All
Setup + Audit en séquence.
Help
Aide détaillée colorée avec exemples.
🔍 Détection RGPD automatique
Le script scanne automatiquement le repo et détecte :
✅ Signaux positifs
- Anonymisation présente : Presidio, hashlib, bcrypt, pseudonymisation
- Mécanismes de sécurité : TLS, authentification, chiffrement, audit logs
⚠️ Signaux d'attention
- Patterns de logging : prompt/réponse loggés (risque de PII en logs)
- Modèles externes : appels Anthropic/OpenAI/Gemini (transfert hors UE possible)
- Télémétries : Sentry, Langfuse, Helicone, wandb (vérifier données transmises)
🔴 Signaux critiques
- Patterns PII : regex emails, téléphones, NIR, IBAN, cartes bancaires dans le code
Ces signaux nourrissent automatiquement la Phase 2 RGPD du prompt.
🌍 Personnalisations sectorielles
Chaque secteur active des contraintes spécifiques dans les prompts :
Healthcare
- HDS (Hébergeur Données de Santé)
- ASIP Santé, HAS, MEDDIC
- Données patient = art. 9 RGPD
- AI Act : annexe III (risque élevé)
Finance
- ACPR / EBA Guidelines
- DORA (Digital Operational Resilience Act)
- Cloud Act US exclu
- Scoring crédit = AI Act risque élevé
Public
- SecNumCloud (ANSSI)
- RGS (Référentiel Général de Sécurité)
- Décret 2021-1361 souveraineté
- Décisions administratives = AI Act potentiellement risque élevé
SME (TPE/PME)
- Pas de DPO obligatoire (référent suffit)
- AIPD simplifiée
- Documentation proportionnée
- Quick wins prioritaires
📊 Structure de sortie
audit_finops_output/
├── context.json # Contexte découvert (avec signaux RGPD)
├── phase1.md → phase8.md # Une phase par fichier
├── RAPPORT_FINAL.md # Synthèse complète
├── TEMPLATE_DPIA.md # (si Dpia exécuté)
├── audit_finops.log # Logs d'exécution
└── comparison_*.md # (après Compare)
🔐 Garde-fous v2
13 garde-fous au lieu de 5 :
Techniques (héritage v1) :
- Aucune dégradation silencieuse
- Aucun chiffre fabriqué
- Lecture seule pendant l'audit
- Mesures avant/après obligatoires
- Pas de comblement du vide
RGPD (nouveaux) : 6. Principe de précaution sur les données 7. Documentation systématique 8. DPO impliqué 9. Pas de régression de conformité 10. Transparence vis-à-vis des personnes
Sécurité (nouveaux) : 11. Pas de divulgation de secrets 12. Pas d'exfiltration 13. Vigilance prompt injection
🔄 Migration depuis v1
Le script v2 est rétrocompatible :
# Ancien usage v1 (toujours valide)
.\Audit-FinOps-v2.ps1 -Command Audit -PromptMode Original
Pour bénéficier des nouvelles fonctionnalités :
# Nouvel usage v2
.\Audit-FinOps-v2.ps1 -Command Audit -PromptMode Complete -Sector <votre_secteur>
📚 Références normatives
Le script s'aligne sur :
- RGPD (UE 2016/679)
- AI Act (UE 2024/1689)
- NIS2 (UE 2022/2555)
- CNIL — Recommandations IA juillet 2024
- ANSSI — Recommandations sécurité IA
- OWASP Top 10 for LLM Applications (2025)
- MITRE ATLAS
- ISO/IEC 42001 — Système de management de l'IA
- ISO/IEC 27001/27002
🎯 Workflow type pour un audit conforme
# Jour 1 — Setup et audit complet
.\Audit-FinOps-v2.ps1 -Command Setup
.\Audit-FinOps-v2.ps1 -Command Audit -PromptMode Complete -Sector Healthcare -Hosting OnPremise
# Jour 1 — Consultation du rapport
Get-Content .\audit_finops_output\RAPPORT_FINAL.md | more
# Jour 2 — Génération DPIA si traitement à risque élevé
.\Audit-FinOps-v2.ps1 -Command Dpia -Sector Healthcare -DpoEmail dpo@example.com
# Jour 2 — Validation par le DPO
# Le DPO révise le RAPPORT_FINAL.md et le TEMPLATE_DPIA.md
# Jour 3 — Baseline avant optimisation
.\Audit-FinOps-v2.ps1 -Command Baseline
# Jours 4-21 — Implémentation des recommandations
# Quick wins d'abord (semaine 1-2)
# Chantiers structurants (semaine 3+)
# Conformité urgente prioritaire
# Jour 22 — Mesure post-optimisation
.\Audit-FinOps-v2.ps1 -Command Measure
.\Audit-FinOps-v2.ps1 -Command Compare
# Mois 4 — Re-audit complet
.\Audit-FinOps-v2.ps1 -Command Audit -PromptMode Complete -Sector Healthcare
❓ FAQ
Q : Quelle différence entre Audit-FinOps.ps1 (v1) et Audit-FinOps-v2.ps1 ?
R : v2 ajoute le volet RGPD/AI Act, 5 secteurs, 6 hébergements, 8 phases en mode Complete, et 3 nouvelles commandes (Discovery, Rgpd, Dpia). Le mode Original de v2 reproduit le comportement de v1.
Q : Mon système ne traite pas de données personnelles, dois-je quand même utiliser le mode Complete ?
R : Non. Le mode Original ou Express est plus rapide. Mais vérifiez bien : un système qui traite des emails, IPs, ou identifiants utilisateurs traite des données personnelles.
Q : Le mode Complete est-il plus lent ? R : Oui, environ 30-50% plus long (8 phases au lieu de 6, prompts plus longs). Mais le livrable est utilisable en audit officiel.
Q : Puis-je personnaliser les prompts ?
R : Oui, modifiez les fonctions Get-PhasePrompt* dans le script. Les prompts sont aussi disponibles en fichiers .md séparés pour modification facile.
Q : Le template DPIA est-il conforme CNIL ? R : Il suit la méthodologie CNIL (guide PIA) mais doit être validé par un DPO qualifié avant tout usage officiel. Le script génère un brouillon à 80%, les 20% restants (validation, arbitrage, contexte business) restent humains.
Q : Comment gérer un audit multi-secteurs ?
R : Lancez plusieurs audits avec différents secteurs et différents OutputDir, puis comparez.
.\Audit-FinOps-v2.ps1 -Command Audit -Sector Healthcare -OutputDir .\audit_sante
.\Audit-FinOps-v2.ps1 -Command Audit -Sector Finance -OutputDir .\audit_finance
📞 Support
- Aide intégrée :
.\Audit-FinOps-v2.ps1 -Command Help - Logs :
.\audit_finops_output\audit_finops.log - Documentation complète : ce README + prompts dans
/mnt/user-data/outputs/
Version : 2.0 Date : 2026-01 Compatibilité : PowerShell 5.1+ / Core 7+ OS : Windows / Linux / macOS
Aucun commentaire:
Enregistrer un commentaire