Blog / 14 avril 2026 · 5 min de lecture

237€ de Claude API en mars. Voilà où est passé l'argent.

Breakdown honnête d'un mois de consommation Claude API en 2026 : quelles tâches coûtent cher, où le prompt caching a sauvé 40%, ce qui vaut le coût et ce qui ne le vaut pas.

J’ai payé 237,40 € de Claude API sur le mois de mars 2026. Pas Claude Code (mon abonnement Max est séparé), pas Claude.ai. Juste l’API, brute, que j’utilise dans des agents maison, des scripts batch et un outil interne. Je tenais à faire le point parce que je vois beaucoup de devs balancer “l’IA c’est abordable” sans jamais sortir de chiffres.

Voilà mon mois, honnêtement, ligne par ligne.

Le breakdown réel

J’ai exporté la facture depuis le dashboard Anthropic. Trois postes dominent :

Poste	Coût	% du total
Agents longue-durée (cron, tâches nocturnes)	142 €	60%
Scripts batch (import de docs, embeddings, classification)	54 €	23%
Requêtes interactives (CLI perso, REPL)	41 €	17%

60% de ma facture vient de trois agents qui tournent en continu. Un agent qui surveille et triage mes issues GitHub, un qui compile des veilles techniques quotidiennes, et un qui prépare des résumés de logs pour mon studio. Tous les trois sur Sonnet 4.6, avec prompt caching.

Ce que le prompt caching a sauvé

Sans prompt caching, la même facture serait probablement autour de 390 €. Le calcul est facile à faire : mes agents chargent systématiquement ~25K tokens de contexte (codebase, instructions, historique condensé) à chaque tour. Sans cache, chaque appel paye ces 25K au prix plein. Avec cache, j’économise ~90% sur cette portion.

Concrètement : passer un appel Sonnet 4.6 sur un prompt de 25K tokens cached + 1K tokens de delta, c’est grosso modo 0,008 €. Sans cache, c’est 0,075 €. La différence est brutale quand on tape 200 appels par jour.

Leçon : si tu construis un agent qui rappelle la même base de contexte plusieurs fois, le caching n’est pas optionnel — c’est la différence entre viable et pas viable économiquement.

Ce qui a coûté cher et qui n’en valait pas la peine

Trois usages sur lesquels j’ai cramé de l’argent sans ROI :

1. Classification de documents sur Opus 4.7 — 38 € pour rien. Je triais des PDFs internes. J’ai démarré sur Opus 4.7 “par habitude”. Après un benchmark, Haiku 4.5 faisait exactement la même tâche à 4% du prix avec un taux d’erreur équivalent (0,8% vs 0,6%, non statistiquement significatif sur 500 docs).

2. Un agent “smart” qui résumait des emails 15 € pour résumer 2000 emails. L’usage : zéro. Personne ne lisait les résumés. J’ai coupé l’agent, gardé l’abonnement à un simple filtre regex + extraction manuelle.

3. Des expérimentations sur Opus 4.7 en tool use agentique Environ 30 €. Pas perdu, c’est de l’apprentissage. Mais à ajouter au budget mental quand on prototype.

Ce qui vaut chaque centime

Les cron agents nocturnes — 142 € bien dépensés. J’ai mesuré : ces trois agents me font gagner ~6h/semaine, soit ~24h/mois. À mon TJM, 142 € c’est l’équivalent de 20 minutes de facturation. ROI évident.

Les batches d’analyse de logs Quand un site de mon studio a un incident, je peux balancer 10 000 lignes de logs à Sonnet 4.6 et récupérer un diagnostic en 30 secondes. Ça m’a sauvé un week-end à Noël. Ça vaut 54 €/mois tout seul.

L’écart Anthropic vs OpenAI

Par curiosité, j’ai refait mes principales tâches sur GPT-5.3 Codex pendant une semaine pour comparer. Trois observations :

Le pricing est plus agressif chez OpenAI sur le modèle équivalent. Environ 15-20% moins cher à tokens égaux.
Le caching d’OpenAI est moins flexible : moins de granularité sur ce qui est caché, donc en pratique moins d’économies.
La qualité agentique reste derrière Claude sur mes cas : suivi d’instructions longues, multi-step, tool use imbriqué. Pour du one-shot, c’est proche.

Conclusion : je reste sur Anthropic pour tout ce qui est agent. Je bascule sur OpenAI quand je fais du batch one-shot où seul le prix compte.

Ce que ça m’apprend pour avril

Mon plan pour ce mois-ci :

Migrer 80% de mon volume sur Haiku 4.5 là où la qualité est équivalente. Objectif : faire tomber la facture à 120-150 €.
Supprimer l’agent “résumé email” — inutile.
Mieux logger les coûts par agent avec un header personnalisé, pour avoir le ROI par cas d’usage le mois prochain.

Je ferai un post-mortem à la fin du mois pour voir si l’optimisation tient.

À retenir

Si tu te lances dans les agents Claude API en 2026 :

Prévois 200-300 €/mois dès que tu as plus de deux agents en prod qui font plus qu’une démo.
Le caching n’est pas optionnel. Sans lui, divise ton ROI par 3.
Ne lance rien sur Opus 4.7 sans avoir testé Sonnet et Haiku avant. Le réflexe “plus gros = mieux” coûte cher.
Mesure le ROI par agent, pas globalement. Certains agents dans ma facture coûtent 5x leur valeur, d’autres 20x.

L’IA est un coût variable. C’est pas “l’abonnement à 20 €”. C’est un poste qui peut exploser si tu ne le watch pas. Et c’est pas grave — c’est juste de la gestion de cloud bill, comme AWS il y a 10 ans.

— Kevin Aubrée

Continuer la lecture

Retour au blog