Audit FinOps · AWS & Scaleway · 2 à 6 jours

C'est pas Versailles ici !

Jusqu'à -72 % sur ta facture cloud.

Les optimisations classiques font -10 à -30 %, et tu peux y arriver par toi-même avec mon guide gratuit. Mon record à -72 % vient d'un changement d'architecture.

On arrête de chauffer des instances pour rien.

Appel diagnostic 30 min, gratuit

Capacité limitée : 2 à 3 audits par mois. Chaque audit demande 2 à 6 jours d'immersion complète.

AWS en prod depuis 2019 | Rakuten, Bedrock Streaming, Monnier Paris | Jusqu'à -72 % sur la facture cloud (Monnier Paris)

Les ~30 % accessibles, fais-les toi-même

Le guide gratuit détaille les 7 leviers que j'utilise en mission (rightsizing, savings plans, ménage), dans le bon ordre, avec les pièges. L'audit, lui, cherche ce que les leviers ne voient pas : l'architecture.

Récupérer le guide

Le problème

Tu reçois ta facture AWS ou Scaleway chaque mois. Tu la regardes 3 secondes, tu soupires, tu paies. Tu sais que tu paies trop. Mais tu ne sais pas combien, ni où ça part, ni combien ça coûterait de changer ça.

5 à 15 %

d'utilisation CPU réelle sur tes instances surdimensionnées. Tu paies un 4xlarge pour faire tourner ce qu'un large encaisserait.

24/7

tes environnements dev/staging tournent en continu alors qu'ils ne servent que 8h par jour.

Ressources orphelines

snapshots oubliés, volumes non rattachés, IPs réservées non utilisées, LB sans cibles. Restes d'anciens projets ou d'ex-employés qui s'accumulent en silence.

0

visibilité de ton équipe dev sur l'impact financier de ses choix d'architecture.

Chaque mois qui passe sans agir, c'est de l'argent brûlé.

Deux situations, deux façons de travailler

Le même audit, mais pas le même rôle pour moi. Dis-moi où tu en es, je m'adapte.

Tu n'as pas d'équipe infra

Je trouve et j'implémente. Tu n'as personne à mobiliser : je fais l'audit, je te restitue le plan d'action, et si tu veux, je mets en place les quick wins moi-même.

Audit + implémentation par la même personne, pas de perte en route
Zéro jargon dans la restitution : des euros par an et des actions
Économies sans recruter ni former personne

Tu as une équipe infra

Je suis le second avis, la contre-expertise externe. Ton équipe garde la main sur l'implémentation, de bout en bout. Mon rôle s'arrête au rapport et à la restitution.

Et non, ton équipe ne va pas se sentir attaquée. L'objectif n'est pas de juger ce qui a été fait, mais de trouver ce qui peut encore l'être. Les findings sont formulés en mode « voici un levier qu'on peut activer », pas en mode « voici ce qui aurait dû être fait ».

Ton équipe co-pilote les calls de cadrage et de restitution
Elle reçoit le rapport en premier, pas après ton board
Un regard externe qui n'a pas hérité des décisions passées, c'est tout

Un exemple de finding

Cas réel observé en mission, anonymisé. Représentatif du niveau de détail du rapport, pas une promesse de résultat identique chez toi.

FINDING-07 · Compute / EC2

Confiance : medium

Instances t3.2xlarge surdimensionnées pour contourner le throttling burstable

L'équipe avait choisi des t3.2xlarge parce que les t3.medium « manquaient de performance ». En réalité, le CPU throttlait une fois les crédits burstables épuisés. Le problème venait du mode burstable (vCPU partagés sur T3), pas de la taille. Passage sur des c5.large à performances constantes (vCPU garantis), plus autoscaling : taille divisée par 4, et le nombre d'instances passe de 12 à 5.

Économie estimée

-80 % sur ce workload

Effort

2 à 3 jours

Confiance

Medium (test de charge requis)

Pourquoi ce finding n'est pas évident : Compute Optimizer recommande de downsizer en restant sur T3, ce qui aurait reproduit le throttling. La clé, c'est le changement de famille (burstable vers compute optimized), pas la taille.

Le livrable, concrètement

Le cœur du rapport, c'est cette table : tous les findings priorisés par ROI. Tu la lis en 10 minutes, tu sais quoi faire et dans quel ordre.

Rapport d'audit · Findings priorisés par ROI

Finding	Éco estimée €/an	Effort (jours)	Confiance
Migration EBS gp2 → gp3 sur les volumes de prod	~20 % du coût EBS	0,5	High

Maquette illustrative du format, pas un rapport client. Première ligne : exemple générique pour donner l'échelle, lignes floutées : à quoi ressemble le reste de la table.

Cartographie complète

Dépenses par service, par compte, par tag, par environnement. Tu sais enfin où part l'argent.

Plan d'action 90 jours

Priorités, effort estimé, dépendances techniques. Implémentable par ton équipe ou par moi.

Dashboard Grafana

Connecté à tes coûts, mis à disposition 3 mois pour suivre l'implémentation. Tu vois la dérive avant qu'elle ne devienne un problème.

Restitution 1h avec ton équipe

En visio, findings argumentés un par un. Plus le playbook FinOps de revue mensuelle des coûts (formule Scale).

La méthode, outil par outil

Pas de boîte noire. Voilà exactement ce que je regarde et avec quoi.

1

Accès read-only, jour 1

Sur AWS : un rôle IAM en lecture seule que tu crées toi-même (template CloudFormation ou Terraform fourni). En multi-comptes AWS Organizations, le même rôle est déployé sur chaque compte via StackSets, et j'analyse la facturation consolidée depuis le compte de management. Aucun workload touché, aucune donnée applicative lue, révocation en supprimant le rôle.

Sur Scaleway : clé API en lecture seule, scopée par projet IAM.

2

Mesurer avant de toucher

Cost Explorer ventilé par les Cost Allocation Tags (je les active s'ils ne le sont pas), Cost and Usage Report quand il existe, Compute Optimizer et Trusted Advisor pour les premières pistes. CloudWatch pour les métriques CPU, et l'agent CloudWatch pour la mémoire si elle n'est pas collectée, activé le temps de l'analyse seulement. Sans données mémoire, pas de rightsizing sérieux. Côté Scaleway : export de facturation par projet et métriques Cockpit.

3

Passer les leviers dans l'ordre

Ménage : ressources orphelines (volumes détachés, snapshots, IPs, LB sans cibles), rétention CloudWatch Logs, lifecycle S3.
Rightsizing : tailles, familles (burstable vs dédiée), générations d'instances, gp2 vers gp3, scheduling des envs dev/staging hors heures ouvrées.
Spot et consolidation : sur Kubernetes, candidats Spot et consolidation Karpenter. Les workloads stateful critiques restent on-demand.
Réseau : NAT Gateway vs VPC Endpoints (S3, ECR, CloudWatch), trafic cross-AZ.
Engagements en dernier : Savings Plans pour EC2/Fargate/Lambda, Reserved Instances pour RDS et ElastiCache (les Compute SP ne les couvrent pas). Après le rightsizing, jamais avant : s'engager sur une infra surdimensionnée, c'est verrouiller le gaspillage.

4

Restituer et outiller

Rapport avec la table des findings priorisés par ROI, plan d'action 90 jours, dashboard Grafana branché sur tes coûts, restitution 1h en visio avec ton équipe. Selon la formule : alertes budget, Cost Anomaly Detection, playbook de revue mensuelle.

Exemple de ROI

Pour un client à 30k EUR/mo de cloud :

· Économies identifiées : 35 000 à 90 000 EUR/an (10 à 30 % du spend selon l'état actuel)
· ROI : la mission se rembourse en 1 à 3 mois
· Retour sur investissement : jusqu'à 13× sur les cas les plus dégradés

Les premiers clients de l'audit cloud

Deux factures, deux contextes, même méthode : on mesure, on coupe ce qui ne sert pas, on dimensionne sur les métriques réelles.

Monnier Paris

Mode & retail luxe, plateforme e-commerce sur Heroku.

-72 %

sur la facture cloud

Ce qui a été fait

· Audit des coûts, puis migration de Heroku vers AWS Elastic Beanstalk
· Right-sizing basé métriques
· Migration de la stack de logs
· Pipeline GitLab CI avec S3 + AWS CLI

Heroku → AWS Elastic Beanstalk GitLab CI S3

"Merci Arthur pour ta disponibilité sur cette migration !"

Florent Palomares · CTO, Monnier Paris

Écris-Moi

App de rencontre, infra sur AWS EKS, à l'approche du lancement.

-69 %

sur les coûts AWS

Ce qui a été fait

· Sizing pods et storage basé sur les métriques réelles
· Autoscaling : Karpenter, HPA, VPA
· Charts Helm prod-ready, dimensionnés au juste besoin

AWS EKS Karpenter HPA / VPA Helm

La même mission comportait un volet stabilisation et monitoring avant lancement : il est documenté côté consulting.

Les avis de mes anciens clients

Questions fréquentes

Comment tu accèdes à mes données AWS / Scaleway ?

Un rôle IAM read-only temporaire que tu crées sur ton compte (CloudFormation template ou Terraform fourni). En multi-comptes AWS Organizations, le rôle est déployé sur chaque compte via StackSets, toujours en lecture seule. Permissions minimales : lecture EC2, RDS, S3 metadata, Cost Explorer, CloudWatch metrics. Pas de credentials persistants chez moi, pas d'accès à tes données applicatives (les buckets S3 contenant tes données ne sont jamais listés). Révocation = tu supprimes le rôle, fin de session. NDA signé en début de mission si tu veux formaliser.

Quels clouds tu audites ?

AWS et Scaleway en profondeur (instances, storage, network, DB managées, Spot/RI/SP, Karpenter, Aurora vs RDS, etc.). Multi-account AWS Organizations supporté. Pour les autres providers (GCP, OVH, Azure), je ne propose pas d'audit aujourd'hui, mieux vaut un spécialiste du cloud en question.

J'ai déjà une équipe infra, l'audit sert à quoi ?

À avoir un second avis. Ton équipe est dans le quotidien, elle a hérité des décisions passées et elle a rarement le temps de tout repasser au crible. Une contre-expertise externe trouve les angles morts (familles d'instances, engagements mal calibrés, réseau) sans rien retirer à ton équipe : elle garde la main sur l'implémentation, co-pilote les calls et reçoit le rapport en premier. Détail dans la section "Deux situations" plus haut.

Combien de temps entre signature et démarrage ?

2 à 3 semaines en moyenne. Le délai vient du planning, pas du setup, je commence par l'accès IAM (1-2 jours) puis 2-6 jours de mission selon la taille de l'infra. Si tu vises un démarrage rapide, dis-le-moi au call diagnostic, je peux parfois caler dans un trou de planning.

Quel est le livrable exact ?

Rapport PDF (10-20 pages selon la taille de l'infra) avec : cartographie des dépenses par service / compte / tag, table des findings priorisés par ROI (économie estimée, effort, dépendances, niveau de confiance high/medium/low), plan d'action 90 jours. Dashboard Grafana de tes coûts mis à disposition pendant 3 mois pour suivre l'implémentation. Restitution en visio 1h avec ton équipe. La structure de la table est montrée plus haut sur cette page.

Quelles certifications tu as ?

CKA + CKS (Kubernetes), affichées sur /consulting. Surtout : AWS en production depuis 2019, sur des infras de la startup au grand groupe (Rakuten, Bedrock Streaming, Monnier Paris, ValueXchange). Tu peux vérifier les profils LinkedIn des contacts cités sur /consulting.

Tu vas pitcher autre chose à la fin ?

Non. L'audit FinOps est une prestation autonome : tu repars avec le rapport et tu en fais ce que tu veux. z3k a d'autres activités (hébergement managé), mais elles sont séparées et je n'aborde le sujet que si tu le fais. Si tu as une équipe infra interne, le rapport te suffit, point.

Toujours pas prêt ? Garde au moins le guide.

Les 7 leviers détaillés (rightsizing, Spot + Karpenter, Savings Plans, gp2 vers gp3, NAT Gateway, et le reste), à appliquer toi-même.

Récupérer le guide

Prochaine étape : un appel de 30 minutes

On regarde ensemble ta facture cloud actuelle. J'identifie en live les 2-3 leviers d'optimisation les plus évidents, et on décide si ça vaut le coup d'aller plus loin. Gratuit, sans engagement.

Prendre RDV, gratuit

2 à 3 audits par mois, pas plus. Si tu vises un démarrage rapide, dis-le-moi au call.