Zum Inhalt springen
MagazinKategorienKosten-GuidesKI & DigitalesFAQKontaktImpressumDatenschutz

Anthropic API Kosten 2026: Claude Opus, Sonnet, Haiku — Preise und Monatsrechnung

Anthropic Claude API kostet 2026 zwischen 0,80 und 75 USD pro Million Tokens je nach Modell — Haiku 3.5 für einfache Tasks, Sonnet 4 als Code-Sweet-Spot und Opus 4 für komplexes Reasoning. Wir zeigen die Preise pro Modell, das Prompt-Caching mit 90 Prozent Input-Rabatt, die Batch-API mit 50 Prozent Rabatt und konkrete Monatskosten-Beispiele für RAG-Systeme, Chatbots und Reasoning-Pipelines. Zum interaktiven Kalkulator: Anthropic-API-Kosten-Rechner.

Hinweis: Einige Links auf dieser Seite sind Affiliate-Links. Wenn Sie über diese Links einen Tarif buchen, erhalten wir möglicherweise eine Provision. Dies beeinflusst nicht unsere redaktionelle Bewertung. Für Sie entstehen keine zusätzlichen Kosten.

Anthropic Claude API Preise 2026 pro Modell

Anthropic Claude wird 2026 als API in drei Hauptmodellen angeboten — Haiku 3.5 für günstige, schnelle Standard-Tasks, Sonnet 4 als Mittelklasse-Workhorse mit dem besten Preis-Qualitäts-Verhältnis für Code-Tasks und Opus 4 als Premium-Modell für komplexe Reasoning-Pipelines. Alle Preise gelten pro Million Tokens, getrennt nach Input (Prompt) und Output (Antwort) — bei Anthropic ist Output 4-5x teurer als Input, ähnlich wie bei OpenAI. Tokens entsprechen ca. 600 deutschen Wörtern pro 1.000 Tokens.

ModellInput / Mio TokensOutput / Mio TokensCache-Hit (Input)Context-WindowEmpfehlung
Claude Haiku 3.50,80 USD4,00 USD0,08 USD200k TokensKlassifikation, Extraction, Q&A
Claude Sonnet 43,00 USD15,00 USD0,30 USD200k TokensCode, Long-Context-RAG, Plan-Mode
Claude Opus 415,00 USD75,00 USD1,50 USD200k TokensMath, Recht, Medizin, Reasoning

Die Cache-Hit-Spalte zeigt den effektiven Input-Preis bei aktivem Prompt-Caching (90 Prozent Rabatt) — ein massiver Hebel für RAG-Systeme und Long-Context-Workflows. Cache-Write hat einen einmaligen 25-Prozent-Aufschlag (Haiku 1,00 USD, Sonnet 3,75 USD, Opus 18,75 USD pro Million Tokens), wird aber bei jedem Cache-Hit sofort amortisiert. Bei Cache-Hit-Rates über 30 Prozent ist Anthropic bei Long-Context-Anwendungen oft günstiger als OpenAI trotz höherem Listenpreis.

Modell-Auswahl-Regel 2026

Einfache Tasks (Klassifikation, Extraction): Haiku 3.5. Standard-Anwendungen (Code-Hilfe, Long-Context-RAG, Plan-Mode-Workflows): Sonnet 4 — der Sweet-Spot. Komplexe Reasoning (Math, Recht, Medizin, mehrstufige Logik): Opus 4. Bei produktiven Apps mit gemischter Nutzung Modell-Routing aufsetzen: einfache Anfragen an Haiku, Code-Tasks an Sonnet, komplexe Reasoning an Opus. Spart 40-60 Prozent gegenüber Single-Modell-Ansatz. Für interaktive Live-Kalkulation siehe den Anthropic-API-Kosten-Rechner.

Prompt-Caching und Batch-API — die zwei Spar-Hebel

Prompt-Caching mit 90 Prozent Input-Rabatt

Anthropic bietet seit 2024 Prompt-Caching mit 90 Prozent Input-Rabatt für Cache-Hits — deutlich aggressiver als OpenAI mit nur 50 Prozent. System-Prompts ab 1.024 Tokens werden gecached, sobald sie zweimal innerhalb von 5 Minuten verwendet werden. Bei produktiven RAG-Systemen mit konstantem System-Prompt (z.B. ein 5.000-Token-Dokumenten-Index) reduziert sich der effektive Input-Preis von 3 USD auf 0,30 USD pro Million Tokens bei Sonnet 4.

Die Cache-TTL beträgt 5 Minuten — der Cache wird bei jedem Hit zurückgesetzt. Bei Anwendungen mit kontinuierlicher Anfrage-Rate (mehrere Anfragen pro 5 Minuten) bleibt der Cache praktisch permanent aktiv. Bei sporadischer Nutzung (weniger als 1 Anfrage pro 5 Minuten) lohnt sich Caching weniger, weil der Cache zwischen Anfragen ausläuft.

Batch-API mit 50 Prozent Rabatt auf Input und Output

Anthropic Batch-API liefert 50 Prozent Rabatt sowohl auf Input als auch Output Tokens — anwendbar wenn die Antwort innerhalb 24 Stunden geliefert werden darf. Sonnet 4 kostet im Batch-Modus nur 1,50 USD Input und 7,50 USD Output pro Million Tokens. Geeignet für asynchrone Workloads wie Klassifikations-Pipelines, Daten-Anreicherung und Inhalts-Generierung in Batches. Nicht geeignet für Echtzeit-Chats und interaktive User-Sessions.

Spar-Hebel-Kombination

Bei asynchronen Pipelines beide Hebel kombinieren: Batch-API (50 Prozent Rabatt) plus Prompt-Caching (90 Prozent Rabatt auf System-Prompt-Anteil). Bei einem Klassifikations-System mit 10.000 Dokumenten pro Monat (je 5.000 Input plus 200 Output Tokens, 80 Prozent System-Prompt-Anteil) ergibt sich: Sonnet 4 normal 165 USD, Sonnet 4 Batch 82 USD, Sonnet 4 Batch plus Caching 28 USD — über 80 Prozent Ersparnis.

Monatskosten-Beispiele für typische Use-Cases

AnwendungModellAnfragen/MonatTokens je AnfrageMonatskostenMit Caching
Klassifikations-ChatbotHaiku 3.510.0002.000 in / 500 out36 USD18 USD
Long-Context-RAGSonnet 45.0008.000 in / 1.000 out195 USD87 USD
Code-AssistentSonnet 420.0001.500 in / 800 out330 USD180 USD
Document-AnalyseSonnet 41.00050.000 in / 5.000 out225 USD105 USD
Reasoning-PipelineOpus 41.0005.000 in / 2.000 out225 USD150 USD
Komplex-WorkflowOpus 450020.000 in / 5.000 out338 USD225 USD

Die Tabelle zeigt typische produktive Use-Cases mit realistischen Token-Schätzungen. Die "Mit Caching"-Spalte unterstellt 70 Prozent Cache-Hit-Rate auf System-Prompt-Anteil — realistisch bei kontinuierlicher Nutzung mit konstanten System-Anweisungen. Bei sporadischer oder Single-Shot-Nutzung gilt der Listenpreis ohne Caching-Rabatt.

Beispielrechnung verstehen — Long-Context-RAG mit Sonnet 4

Ein typisches Long-Context-RAG-System verarbeitet 5.000 Anfragen pro Monat. Pro Anfrage werden 8.000 Input-Tokens (System-Prompt 5.000 plus Retrieved-Documents 2.500 plus User-Query 500) und 1.000 Output-Tokens generiert. Ohne Caching kostet das: 5.000 × (8.000 × 3 + 1.000 × 15) / 1.000.000 = 195 USD pro Monat. Mit Prompt-Caching bei 70 Prozent Cache-Hit-Rate auf den 5.000-Token-System-Prompt-Anteil: System-Prompt-Anteil 5.000 × 0,30 / 1.000.000 × 0,7 + 5.000 × 3 / 1.000.000 × 0,3 + Retrieved-Documents 2.500 × 3 / 1.000.000 + Output 1.000 × 15 / 1.000.000, alle mal 5.000 Anfragen = ca. 87 USD — über 55 Prozent Ersparnis.

Anthropic vs OpenAI vs Google — API-Preisvergleich 2026

Modell-TierAnthropicOpenAIGoogle GeminiEmpfehlung 2026
Premium-ReasoningOpus 4: 15/75 USDo1: 15/60 USDGemini 2.5 Pro: 1,25/10 USDAnthropic Opus 4 für multi-step
Standard / Code-Sweet-SpotSonnet 4: 3/15 USDGPT-4o: 2,50/10 USDGemini 2.5 Flash: 0,15/0,60 USDAnthropic Sonnet 4 für Code
Günstig / Massen-TasksHaiku 3.5: 0,80/4 USDGPT-4o-mini: 0,15/0,60 USDGemini Flash-Lite: 0,075/0,30 USDOpenAI GPT-4o-mini für Volumen
Multi-Modal (Vision)Sonnet 4 mit VisionGPT-4o mit VisionGemini 2.5 Pro nativGoogle Gemini für Vision

Bei Code-Tasks ist Anthropic Claude Sonnet 4 die unangefochtene Wahl 2026 — Tool-Use-Stabilität, Long-Context-Treue und Plan-Mode-Workflows sind besser als bei OpenAI. Bei Massen-Klassifikation hat OpenAI GPT-4o-mini einen 5-fachen Preis-Vorteil gegenüber Haiku 3.5. Bei Multi-Modal Vision ist Google Gemini 2.5 Pro mit nativem Vision-Token-Pricing der Preis-Sieger. Bei komplexem Reasoning mit mehrstufiger Logik gewinnt Anthropic Opus 4 trotz 25 Prozent Preisaufschlag gegenüber OpenAI o1.

Wann wechseln, wann bleiben — Praxis-Empfehlung

Wer aktuell OpenAI-API verwendet und auf Anthropic wechseln will, sollte zwei Aspekte prüfen: erstens die Cache-Hit-Rate-Erwartung — bei hoher Rate (über 30 Prozent) ist Anthropic oft günstiger trotz höherem Listenpreis. Zweitens die Tool-Use-Komplexität — bei komplexen Tool-Chains (mehr als 3 Tools, mehrstufige Calls) ist Claude stabiler. Bei einfachen Single-Shot-Klassifikations-Tasks ohne Tools bleibt OpenAI GPT-4o-mini der Preis-Sieger. Detaillierter Vergleich: Claude vs ChatGPT Kosten und Claude Pro vs Claude Code 2026.

Verwandte KI-Themen im Hub

Wer Anthropic Claude API einsetzt, profitiert oft auch von begleitenden Tool-Guides: ChatGPT Kosten als Web-Interface-Alternative für Power-User, Claude Pro Kosten für Chat-Interface ohne API, Microsoft Copilot Kosten für Office-Integration und Perplexity Pro Kosten für Such-Antwort-Engine. Alle Anthropic-Tarife im Hub: KI & Digitales Hub.

Anzeige

Internet-Tarif für API-Streaming

Wer Claude-API mit Streaming und langem Context produktiv nutzt, profitiert von schnellem Internet. Tarife unverbindlich vergleichen — bis zu drei Angebote in 24 Stunden.

Tarife vergleichen →
Affiliate-Link via Awin Netzwerk (Check24 Publisher-Programm). Externer Vermittlungsdienst. Keine Mehrkosten.
Sponsor-Link: Beim Klick werden Sie zu Check24 weitergeleitet. KPR erhält möglicherweise eine Provision. Für Sie entstehen keine Mehrkosten.

Häufige Fragen zu Anthropic API Kosten 2026

Was kostet Claude Haiku 3.5 pro Million Tokens?
0,80 USD Input und 4,00 USD Output. Mit Prompt-Caching nur 0,08 USD Input pro Cache-Hit.
Was kostet Claude Sonnet 4?
3,00 USD Input und 15,00 USD Output pro Million Tokens. Cache-Hit-Input nur 0,30 USD. Im Batch 1,50 / 7,50 USD.
Was kostet Claude Opus 4?
15,00 USD Input und 75,00 USD Output pro Million Tokens. Premium-Modell für komplexes Reasoning.
Wie funktioniert Prompt-Caching?
90 Prozent Input-Rabatt für Cache-Hits ab 1.024 Tokens System-Prompt. TTL 5 Minuten, jedes Hit setzt TTL zurück.
Was ist die Batch-API?
50 Prozent Rabatt auf Input und Output bei 24-Stunden-Lieferung. Geeignet für asynchrone Pipelines.
Wo finde ich den interaktiven Rechner?
Der interaktive Anthropic-API-Kostenrechner mit Live-Berechnung steht unter /kosten/anthropic-api-kosten-rechner.html bereit.
Anthropic vs OpenAI für Code?
Claude Sonnet 4 ist 2026 besser bei Code-Tasks, Tool-Use und Long-Context. OpenAI GPT-4o-mini ist günstiger bei Massen-Klassifikation.
Long-Context bei Claude?
Alle Claude-Modelle 2026 unterstützen 200.000 Tokens Context-Window. Mit Caching kosten 100k Tokens nur 1 USD bei Sonnet 4.
Bezahlung in DACH?
USD-Rechnung mit Tageskurs-Konvertierung. Reverse-Charge mit UID für Selbstständige. Endverbraucher 19/20/8,1 Prozent USt.
Rate-Limits der Claude API?
Tier 1: 50 RPM, 50k TPM, 1 Mio TPD. Tier 4 (Enterprise): 4.000 RPM, 400k TPM, 100 Mio TPD. Aufstieg automatisch nach 14 Tagen.

Fazit — Anthropic API 2026

Anthropic Claude API ist 2026 die Code-Tasks-Premium-Wahl mit dem aggressivsten Prompt-Caching im Markt (90 Prozent Rabatt). Sonnet 4 ist der Sweet-Spot für produktive Anwendungen mit Long-Context-RAG, Code-Hilfe und Plan-Mode-Workflows — bei einem typischen RAG-System mit 5.000 Anfragen pro Monat liegen die Kosten ohne Caching bei 195 USD, mit aktivem Caching bei nur 87 USD. Haiku 3.5 ist für Massen-Klassifikation 5x teurer als OpenAI GPT-4o-mini — hier lohnt der Wechsel nur bei hoher Cache-Hit-Rate. Opus 4 ist die unangefochtene Wahl für komplexes Reasoning trotz 75 USD Output-Preis.

Die zwei wichtigsten Spar-Hebel sind Prompt-Caching (90 Prozent Input-Rabatt bei stabilen System-Prompts) und Batch-API (50 Prozent auf Input und Output bei 24-Stunden-Lieferung). Bei kombinierter Anwendung in asynchronen Pipelines ergeben sich Ersparnisse über 80 Prozent gegenüber dem Listenpreis. Wer die interaktive Live-Kalkulation seines konkreten Use-Cases sehen will, nutzt unseren Anthropic-API-Kosten-Rechner mit Eingabe-Feldern für Modell, Tokens und Anfragen-Anzahl.

Alle Angaben Stand Mai 2026. Quellen: Anthropic Pricing Page 2026-Q2, AWS Bedrock Pricing 2026, eigene Recherche zu Cache-Hit-Rate-Verteilungen in produktiven RAG-Systemen. Preise variieren mit Wechselkurs USD/EUR. Tarife werden bei jeder bekannten Anbieter-Preisanpassung aktualisiert.

KPR
Redaktion Kosten-Preise-Ratgeber
Fachredaktion für KI-, Cloud- und API-Kosten. Alle Angaben redaktionell geprüft und regelmässig aktualisiert.