Wie viel kostet Claude 3.5 Sonnet?

Claude 3.5 Sonnet kostet $3,00 pro Million Eingabe-Token und $15,00 pro Million Ausgabe-Token (Anthropic API, Juni 2026).

LLM-PREISELEITFADENGPT-4OCLAUDE2026

So schätzen Sie Ihre LLM-API-Kosten im Jahr 2026 — GPT-4o, Claude 3.5 & Gemini im Vergleich

Q: Wie viel kostet GPT-4o pro 1 Million Token?

GPT-4o kostet $2,50 pro Million Eingabe-Token und $10,00 pro Million Ausgabe-Token (Pay-as-you-go, Juni 2026).

Q: Ist Gemini günstiger als GPT-4o?

Gemini 1.5 Flash ist mit $0,075/M Eingabe und $0,30/M Ausgabe deutlich günstiger, aber ein leichteres Modell. Gemini 1.5 Pro ($1,25/$5,00) ist GPT-4o näher und etwa halb so teuer bei Eingabe-Token.

2. Juni 2026 · 12 Min. Lesezeit · Von APICalculators

LLM-APIs ohne Kostenmodell in Produktion zu betreiben, ist der Weg zu einer fünfstelligen Cloud-Rechnung am Montagmorgen. Dieser Leitfaden liefert die genaue Formel, eine aktuelle 2026-Preistabelle aller großen Anbieter und drei reale Rechenbeispiele.

Warum LLM-Kosten schwer vorhersehbar sind

Anders als klassische SaaS-Preise (feste Monatsgebühr) berechnen LLM-APIs pro Token — eine Texteinheit von etwa ¾ eines Wortes. Die Kosten sind nicht linear, sondern werden vom Zusammenspiel von vier Variablen bestimmt:

Eingabe-Token — System-Prompt + Nutzernachricht + Gesprächsverlauf
Ausgabe-Token — die Antwort des Modells, die Sie nicht vollständig steuern
Modellstufe — Flaggschiff-Modelle kosten 10–50× mehr als Mini-Varianten
Anfragevolumen — Anzahl der API-Aufrufe pro Tag/Monat

Die Kostenformel

Kosten pro Anfrage

kosten = (eingabe_token × eingabepreis_pro_1M / 1.000.000)
+ (ausgabe_token × ausgabepreis_pro_1M / 1.000.000)

Monatliche Kosten

monatlich = kosten_pro_anfrage × anfragen_pro_tag × 30

2026 LLM-Preistabelle

Alle Preise in USD, Pay-as-you-go, pro 1 Million Token, Stand Juni 2026.

Modell	Anbieter	Eingabe / 1M	Ausgabe / 1M
GPT-4o	OpenAI	$2,50	$10,00
GPT-4o mini	OpenAI	$0,15	$0,60
Claude 3.5 Sonnet	Anthropic	$3,00	$15,00
Claude 3.5 Haiku	Anthropic	$0,80	$4,00
Gemini 1.5 Pro	Google	$1,25	$5,00
Gemini 1.5 Flash	Google	$0,075	$0,30

🧮 Berechnen Sie Ihre genauen Monatskosten

Geben Sie Modell, Token-Zahlen und Anfragevolumen ein — erhalten Sie eine Live-Schätzung in Sekunden.

LLM-Kostenrechner öffnen →

5 Wege, Ihre LLM-Rechnung zu senken

1. Verwenden Sie das günstigste Modell, das Ihre Qualität erfüllt

Die wichtigste Entscheidung. Führen Sie einen A/B-Test zwischen GPT-4o mini und GPT-4o auf Ihren echten Prompts durch. Für Klassifizierung, Extraktion und einfache Q&A sind Mini-Modelle oft nicht von Flaggschiffen zu unterscheiden — bei 10× geringeren Kosten.

2. Kürzen Sie Ihren System-Prompt

Jedes Token im System-Prompt wird bei jeder Anfrage berechnet. Sparen Sie 500 Token bei 100.000 Anfragen/Monat, sparen Sie 50M Eingabe-Token — etwa $12,50/Monat bei GPT-4o mini, $125/Monat bei GPT-4o.

3. Aktivieren Sie Prompt-Caching

Anthropic und Google bieten Prompt-Caching, das die Kosten wiederholter Kontexte drastisch senkt. Cache-Treffer werden mit 10–25% des normalen Eingabepreises berechnet.

4. Nutzen Sie die Batch-API für asynchrone Workloads

OpenAI und Anthropic bieten eine Batch-API (Ergebnisse innerhalb 24h) zu 50% des Standardpreises. Für alle Workloads ohne Echtzeitanforderung ist das geschenktes Geld.

5. Begrenzen Sie Ausgabe-Token explizit

Setzen Sie max_tokens auf das realistische Maximum. Eine Antwort, die von 500 auf 2.000 Token wächst, vervierfacht Ihre Ausgabekosten.

Häufig gestellte Fragen

Wie viel kostet GPT-4o pro 1 Million Token?

GPT-4o kostet $2,50 pro Million Eingabe-Token und $10,00 pro Million Ausgabe-Token (Juni 2026).

Ist Gemini günstiger als GPT-4o?

Ja. Gemini 1.5 Flash ist dramatisch günstiger ($0,075/$0,30 pro Million), aber ein leichteres Modell. Gemini 1.5 Pro ist etwa halb so teuer wie GPT-4o bei Eingabe-Token und bietet ein 1-Million-Token-Kontextfenster.

🔤 Mit Ihren eigenen Zahlen testen

Der Rechner aktualisiert sich live mit Ihrer Summe und einer Aufschlüsselung pro Anfrage.

LLM-Kostenrechner öffnen →

🧮

APICalculators Team

Wir bauen kostenlose, datenschutzfreundliche Kostenrechner für Entwickler. Preisdaten stammen direkt aus offizieller Anbieterdokumentation und werden monatlich geprüft.