Just launched — free access for everyone until July 4

price tracker · updated 2026-06-14

Cheapest Llama 3.3 70B API

llm · per 1M output tokens

Llama 3.3 70B inference ranges from $0.30 to $1.20 per 1M output tokens depending on provider — Groq is the cheapest verified endpoint.

provider rankingsave up to 75%

Llama 3.3 70B

llm · per 1M output tokens

save up to 75%

Cheapest verified endpoint: groq at $0.30 (llm · per 1M output tokens). Prices normalized per unit, ex. egress.

How we track this

We re-pull every known provider that serves Llama 3.3 70B weekly, normalize to a single unit (llm · per 1M output tokens), and pin the price the moment a provider posts it — we don't average across stale snapshots. Switching providers is usually a one-line base-URL change. Spot a stale price? tell us.

Other models we track

Cheapest Seedance 2.0 API

video gen · 5s @ 1080p · save up to 84%

Cheapest Nano Banana Pro API

image gen · 1024² · per image · save up to 55%

Cheapest DeepSeek-V3 API

llm · per 1M output tokens · save up to 41%

Cheapest DeepSeek-R1 API

llm · per 1M output tokens · save up to 69%

Cheapest Llama 4 Maverick API

llm · per 1M output tokens · save up to 29%

Cheapest Llama 4 Scout API

llm · per 1M output tokens · save up to 49%

Cheapest Llama 3.1 405B API

llm · per 1M output tokens · save up to 13%

Cheapest Llama 3.1 8B API

llm · per 1M output tokens · save up to 72%

Cheapest Qwen2.5 72B API

llm · per 1M output tokens · save up to 67%

Cheapest Qwen3 235B A22B API

llm · per 1M output tokens · save up to 67%

Cheapest Mistral Nemo API

llm · per 1M output tokens · save up to 76%

Cheapest Mistral Small 3 API

llm · per 1M output tokens · save up to 33%

Cheapest Kimi K2 API

llm · per 1M output tokens · save up to 56%

Cheapest GLM-4.6 API

llm · per 1M output tokens · save up to 21%

Cheapest gpt-oss-120b API

llm · per 1M output tokens · save up to 75%

Cheapest GPT-5.5 API

llm · per 1M output tokens · save up to 50%

Cheapest GPT-5.4 API

llm · per 1M output tokens · save up to 50%

Cheapest GPT-5.4 mini API

llm · per 1M output tokens · save up to 50%

Cheapest GPT-4.1 API

llm · per 1M output tokens · save up to 50%

Cheapest GPT-4o API

llm · per 1M output tokens · save up to 50%

Cheapest o3 API

llm · per 1M output tokens · save up to 50%

Cheapest o4-mini API

llm · per 1M output tokens · save up to 50%

Cheapest Claude Opus 4.7 API

llm · per 1M output tokens · save up to 50%

Cheapest Claude Sonnet 4.6 API

llm · per 1M output tokens · save up to 50%

Cheapest Claude Haiku 4.5 API

llm · per 1M output tokens · save up to 50%

Cheapest Gemini 2.5 Pro API

llm · per 1M output tokens · save up to 50%

Cheapest Gemini 2.5 Flash API

llm · per 1M output tokens · save up to 50%

Cheapest FLUX1.1 [pro] API

image gen · 1024² · per image · save up to 20%

Cheapest FLUX.1 [dev] API

image gen · 1024² · per image · save up to 17%

Cheapest FLUX.1 [schnell] API

image gen · 1024² · per image

Cheapest Stable Diffusion 3.5 Large API

image gen · 1024² · per image

Cheapest gpt-image-1 API

image gen · 1024² · medium · per image · save up to 5%

Cheapest Ideogram 3.0 API

image gen · 1024² · Quality · per image

Cheapest Recraft V3 API

image gen · 1024² · raster · per image

Cheapest Imagen 4 API

image gen · 1024² · Standard · per image

Cheapest Veo 3 API

video gen · ~5s @ 1080p · save up to 33%

Cheapest Veo 3 Fast API

video gen · ~5s @ 1080p · with audio · save up to 80%

Cheapest Sora 2 API

video gen · 5s @ 720p · save up to 60%

Cheapest Kling 2.5 Turbo Pro API

video gen · 5s @ 1080p · save up to 40%

Cheapest Luma Ray 2 API

video gen · 5s @ 1080p · save up to 20%

Cheapest Wan 2.5 API

video gen · 5s @ 1080p · save up to 33%

Cheapest MiniMax Hailuo 02 API

video gen · 5s @ 1080p · Pro · save up to 17%

Cheapest Whisper Large v3 API

transcription · per minute · save up to 73%

Cheapest Deepgram Nova-3 API

transcription · per minute · save up to 58%

Cheapest AssemblyAI Universal API

transcription · per minute · save up to 58%

Cheapest OpenAI gpt-4o-transcribe API

transcription · per minute · save up to 58%

Cheapest ElevenLabs TTS API

tts · per 1M characters · save up to 85%

Cheapest OpenAI TTS API

tts · per 1M characters · save up to 50%

Cheapest Deepgram Aura TTS API

tts · per 1M characters · save up to 70%

Cheapest OpenAI text-embedding-3-small API

embeddings · per 1M tokens · save up to 80%

Cheapest OpenAI text-embedding-3-large API

embeddings · per 1M tokens · save up to 85%

Cheapest Cohere Embed v4 API

embeddings · per 1M tokens · save up to 83%

Cheapest Voyage-3 API

embeddings · per 1M tokens · save up to 83%

Cheapest Grok 4 Fast API

llm · per 1M output tokens

Cheapest Qwen3 Coder 480B A35B API

llm · per 1M output tokens · save up to 44%

Cheapest MiniMax M2 API

llm · per 1M output tokens · save up to 17%

Cheapest gpt-oss-20b API

llm · per 1M output tokens · save up to 53%

Cheapest Command A API

llm · per 1M output tokens

Cheapest Seedream 4.0 API

image gen · 1024² · per image · save up to 42%

Cheapest Nano Banana (Gemini 2.5 Flash Image) API

image gen · 1024² · per image

Cheapest FLUX.2 [pro] API

image gen · 1024² · per image · save up to 33%

Cheapest FLUX.2 [dev] API

image gen · per megapixel

Cheapest Reve Image 1.0 API

image gen · 1024² · per image

Cheapest Qwen-Image API

image gen · per megapixel · save up to 5%

Cheapest Veo 3.1 API

video gen · 5s @ 1080p · with audio

Cheapest Veo 3.1 Fast API

video gen · 5s @ 1080p · with audio

Cheapest Seedance 1.0 Pro API

video gen · 5s @ 1080p · save up to 16%

Cheapest MiniMax Hailuo 2.3 Pro API

video gen · ~6s @ 1080p · Pro

Cheapest Vidu Q1 API

video gen · 5s @ 1080p

Cheapest PixVerse V5 API

video gen · 5s @ 1080p

Cheapest LTX 2.3 Pro API

video gen · 5s @ 1080p · save up to 33%

Cheapest Pika 2.2 API

video gen · 5s @ 1080p · save up to 56%

Cheapest Runway Gen-4 Turbo API

video gen · 5s @ 720p

Cheapest Google gemini-embedding-001 API

embeddings · per 1M tokens · save up to 93%

Cheapest voyage-3.5 API

embeddings · per 1M tokens · save up to 87%

Cheapest voyage-3.5-lite API

embeddings · per 1M tokens · save up to 83%

Cheapest Qwen3-Embedding API

embeddings · per 1M tokens · save up to 83%

Cheapest Mistral codestral-embed API

embeddings · per 1M tokens · save up to 89%

Cheapest Hume Octave TTS API

tts · per 1M characters · save up to 92%

Cheapest Inworld TTS API

tts · per 1M characters · save up to 70%

Cheapest Google Chirp 3 HD API

tts · per 1M characters · save up to 92%

Cheapest Azure AI Speech TTS API

tts · per 1M characters · save up to 70%

Cheapest ElevenLabs Scribe API

transcription · per minute · save up to 65%

Cheapest Speechmatics API

transcription · per minute · save up to 65%

Cheapest Gladia API

transcription · per minute · save up to 61%

Cheapest Fireworks Whisper-v3 API

transcription · per minute · save up to 75%

Building on AI? Don't pay full price.

Perkstack also tracks 200+ verified AI tool credits and startup grants — free with an account.

Browse the catalog →Create a free account