AI Models Directory

Route these models through VG Code — Vibgrate Relay is one account and endpoint for the models in this catalog, with per-token metering and governance.

Meet Vibgrate Relay

Showing 402 models

Alibaba·Jul 27, 2026

Qwen3.7 Flash

Qwen3.7 Flash is a fast hosted Qwen model variant added to OpenRouter with a 1,000,000-token context window. It is suited for long-context text, reasoning, and general assistant workloads where lower latency is important.

text-generationreasoninglong-context+1

1.0M Docs

Anthropic·Jul 24, 2026

Claude Opus 5

Anthropic's most capable Opus model, positioned for advanced reasoning, agentic systems, and production inference workloads.

text-generationreasoningagentic-workflows

1.0M Docs

Anthropic·Jul 24, 2026

Claude Opus 5 Fast

A faster hosted variant of Claude Opus 5 with the same 1M-token context window, aimed at lower-latency use in advanced reasoning and agentic workflows.

text-generationreasoningagentic-workflows

1.0M Docs

InclusionAI·Jul 23, 2026

Ling 3.0 Flash

Ling 3.0 Flash is a hosted general-purpose language model from InclusionAI, newly listed on OpenRouter with a 262K-token context window. The Flash variant is positioned for fast, long-context chat and reasoning workloads.

text-generationchatreasoning+1

262K Docs

Poolside·Jul 21, 2026

Laguna S 2.1

Laguna S 2.1 is a long-context foundation model from Poolside, newly listed on OpenRouter and also present in the Ollama library. The OpenRouter listing reports a 1,048,576-token context window.

text-generationlong-context

1.0MOpen Weight Docs

Google·Jul 21, 2026

Gemini 3.6 Flash

Gemini 3.6 Flash is a Google Gemini model newly added to OpenRouter with a 1,048,576-token context window. It is positioned as a Flash-family hosted model for long-context text generation and reasoning workloads.

text-generationreasoninglong-context

1.0M Docs

Google·Jul 21, 2026

Gemini 3.5 Flash-Lite

Gemini 3.5 Flash-Lite is a lightweight Google Gemini hosted model newly added to OpenRouter with a 1,048,576-token context window. It is suited to cost- and latency-sensitive long-context text generation workloads.

text-generationlong-contextlow-latency

1.0M Docs

Meituan·Jul 20, 2026

LongCat 2.0

LongCat 2.0 is a Meituan long-context foundation model newly added to OpenRouter. The listing reports a 1,048,756-token context window for hosted text-generation workloads.

text-generationlong-context

1.0M Docs

Thinking Machines·Jul 17, 2026

Inkling

Inkling is a hosted model newly listed on OpenRouter with a 1,048,576-token context window. The discovery data verifies its availability and long-context capability, but does not provide further architectural or benchmark details.

text-generationlong-context

1.0M Docs

Moonshot AI·Jul 16, 2026

Kimi K3

Kimi K3 is a Moonshot AI long-context hosted language model added to OpenRouter with a 1,048,576-token context window. It is positioned for large-context text, reasoning, and coding workloads.

text-generationlong-contextreasoning+1

1.0M Docs

Meta·Jul 16, 2026

Muse Spark 1.1

Muse Spark 1.1 is a Meta model added to OpenRouter with a 1,048,576-token context window. The discovery data verifies it as a newly listed long-context hosted model.

text-generationlong-context

1.0M Docs

KwaiPilot·Jul 10, 2026

KAT Coder Air v2.5

KAT Coder Air v2.5 is a code-focused model from the KwaiPilot namespace added to OpenRouter with a 256,000-token context window. It appears to be the lighter Air variant of the KAT Coder v2.5 family.

code-generationlong-contexttext-generation

256K Docs

KwaiPilot·Jul 10, 2026

KAT Coder Pro v2.5

KAT Coder Pro v2.5 is a code-focused model from the KwaiPilot namespace added to OpenRouter with a 256,000-token context window. It appears to be the higher-capability Pro variant of the KAT Coder v2.5 family.

code-generationlong-contexttext-generation

256K Docs

OpenAI·Jul 9, 2026

GPT-5.6 Luna Pro

OpenRouter-listed GPT-5.6 hosted model variant with a 1,050,000-token context window. It is positioned as a long-context frontier text model for demanding reasoning and productivity workloads.

text-generationreasoningcode-generation+1

1.1M Docs

OpenAI·Jul 9, 2026

GPT-5.6 Luna

OpenRouter-listed GPT-5.6 hosted model variant with a 1,050,000-token context window. It is intended for broad long-context text, coding, and reasoning use cases.

text-generationreasoningcode-generation+1

1.1M Docs

OpenAI·Jul 9, 2026

GPT-5.6 Terra Pro

OpenRouter-listed GPT-5.6 hosted model variant with a 1,050,000-token context window. It is a proprietary long-context model for advanced text generation, reasoning, and coding workflows.

text-generationreasoningcode-generation+1

1.1M Docs

OpenAI·Jul 9, 2026

GPT-5.6 Terra

OpenRouter-listed GPT-5.6 hosted model variant with a 1,050,000-token context window. It targets long-context general-purpose assistance, reasoning, and code-generation tasks.

text-generationreasoningcode-generation+1

1.1M Docs

OpenAI·Jul 9, 2026

GPT-5.6 Sol Pro

OpenRouter-listed GPT-5.6 hosted model variant with a 1,050,000-token context window. It is a proprietary long-context model for high-end reasoning, coding, and productivity workloads.

text-generationreasoningcode-generation+1

1.1M Docs

OpenAI·Jul 9, 2026

GPT-5.6

OpenAI frontier general-purpose model announced as delivering more intelligence per token, stronger performance per dollar, and scalable capability for demanding work.

text-generationreasoningcode-generation+2

1.1M Docs

OpenAI·Jul 8, 2026

GPT-Live

OpenAI voice model generation for natural human-AI interaction, announced as powering ChatGPT Voice.

voicespeech-to-speechaudio-input+2

N/A Docs

xAI·Jul 8, 2026

Grok 4.5

xAI hosted Grok model newly added on OpenRouter with a 500k-token context window for long-context general AI tasks.

text-generationreasoningcode-generation+1

500K Docs

Aion Labs·Jul 7, 2026

Aion 3.0

Aion Labs hosted general-purpose model newly added on OpenRouter with a 131k-token context window.

text-generationlong-context

131K Docs

Aion Labs·Jul 7, 2026

Aion 3.0 Mini

Smaller Aion Labs hosted model newly added on OpenRouter with a 131k-token context window.

text-generationlong-context

131K Docs

Tencent·Jul 6, 2026

Tencent HY3

Tencent long-context hosted model newly added on OpenRouter with a 262k-token context window.

text-generationlong-context

262K Docs

Poolside·Jul 2, 2026

Laguna XS 2.1

Laguna XS 2.1 is a Poolside model added to OpenRouter with a 262K-token context window and also available in the Ollama library. It is suited to long-context coding and text workflows.

code-generationlong-contexttext-generation

262KOpen Weight Docs

NVIDIA·Jul 1, 2026

NVIDIA Nemotron 3 Nano

NVIDIA Nemotron 3 Nano is an open-weight Nemotron model family referenced as newly supported on Amazon Bedrock in AWS GovCloud, including Nano 9B v2, Nano 12B v2, and Nano 30B variants.

text-generationinstruction-following

N/AOpen Weight Docs

Anthropic·Jun 30, 2026

Claude Sonnet 5

Anthropic's latest-generation Sonnet model, described as its most capable Sonnet model and made available on Amazon Bedrock, Claude Platform on AWS, and OpenRouter.

text-generationreasoningcode-generation+1

1.0M Docs

Google·Jun 30, 2026

Gemini 3.1 Flash-Lite Image

A Google Gemini 3.1 Flash-Lite image model added to OpenRouter, providing image-focused multimodal capabilities with a 65,536-token context window.

visionimage-generationmultimodal

66K Docs

Amazon·Jun 29, 2026

Amazon Nova 2 Lite

Amazon Nova 2 Lite is a lightweight multimodal Nova model referenced for cost-optimized scanned document processing, where it handles native multimodal extraction before downstream Claude processing.

multimodalvisiondocument-understanding+1

N/A Docs

OpenAI·Jun 26, 2026

GPT-5.6 Sol

GPT-5.6 Sol is a next-generation OpenAI model previewed with stronger capabilities in coding, science, and cybersecurity, paired with OpenAI's most advanced safety stack.

code-generationscientific-reasoningcybersecurity+2

N/A

Sakana AI·Jun 24, 2026

Fugu Ultra

Fugu Ultra is a Sakana model listed on OpenRouter with a 1M-token context window. It is positioned for long-context general-purpose reasoning and text generation.

long-contextreasoningtext-generation

1.0M Docs

OpenAI·Jun 22, 2026

GPT-5.5-Cyber

Cybersecurity-focused OpenAI model introduced with Daybreak tools to help organizations find, validate, and patch vulnerabilities at scale.

cybersecurityvulnerability-detectioncode-analysis+1

N/A

Google·Jun 18, 2026

Gemini 3.1 Flash Image

Google Gemini image-focused model listed on OpenRouter with a 131,072-token context window. It is positioned as a Flash-tier multimodal/image model for lower-latency image-centric workloads.

multimodalvisionimage-generation

131K Docs

Google·Jun 18, 2026

Gemini 3 Pro Image

Google Gemini Pro-tier image-focused model listed on OpenRouter with a 65,536-token context window. It targets higher-capability multimodal and image-generation use cases than Flash-tier variants.

multimodalvisionimage-generation

66K Docs

Zhipu AI / Z.ai·Jun 16, 2026

GLM-5.2

GLM-5.2 is a Z.ai / Zhipu AI foundation model listed on OpenRouter with a 1,048,576-token context window and available in the Ollama library. It targets long-context reasoning, generation, and coding workloads.

reasoninglong-contexttext-generation+1

1.0MOpen Weight Docs

Moonshot AI·Jun 12, 2026

Kimi K2.7 Code

Kimi K2.7 Code is a Moonshot AI coding-focused model listed on OpenRouter with a 262K-token context window and available in the Ollama library. It is aimed at software engineering and long-context code understanding tasks.

code-generationlong-contextreasoning

262KOpen Weight Docs

Google DeepMind·Jun 10, 2026

DiffusionGemma

An experimental open model from Google DeepMind built for exceptionally fast text generation, with NVIDIA optimizations for local and accelerated inference across RTX, RTX PRO, and DGX Spark systems.

text-generationfast-inferencelocal-inference

N/AOpen Weight

Cohere·Jun 9, 2026

North Mini Code

Cohere’s first model for developers, focused on coding and developer-assistance workflows.

code-generationdeveloper-assistancetext-generation

N/AOpen Weight

Anthropic·Jun 9, 2026

Claude Fable 5

Claude Fable 5 is a newly listed Anthropic model on OpenRouter with a 1,000,000-token context window. The discovery data verifies it as a new Anthropic model added during the target date range.

text-generationreasoninglong-context

1.0M Docs

NVIDIA·Jun 4, 2026

NVIDIA Nemotron 3 Ultra 550B A55B

NVIDIA Nemotron 3 Ultra 550B A55B is a large open-weight Nemotron-family model listed on OpenRouter with a 1M-token context window and available in the Ollama library. It is intended for long-context reasoning and general text-generation workloads.

reasoninglong-contexttext-generation+1

1.0MOpen Weight Docs

Alibaba·Jun 3, 2026

Qwen3.7 Plus

A Qwen-family large language model added on OpenRouter with a 1,000,000-token context window for long-context general-purpose AI workloads.

text-generationlong-context

1.0M Docs

Google·May 28, 2026

Gemini Omni

Gemini Omni is a Google Gemini-family model announced at Google I/O 2026 and showcased in Google demos alongside Gemini 3.5. The discovery data verifies the announcement but does not provide context length, output limit, or pricing details.

multimodal

N/A Docs

Anthropic·May 27, 2026

Claude Opus 4.8

Anthropic's Claude Opus 4.8 is a proprietary frontier model listed on OpenRouter and announced as available on AWS. The provided data highlights its use for agentic systems and production inference workloads, with a 1,000,000-token context window.

text-generationreasoninglong-context+1

1.0M Docs

Anthropic·May 27, 2026

Claude Opus 4.8 Fast

Claude Opus 4.8 Fast is an Anthropic model variant added to OpenRouter with a 1,000,000-token context window. It is positioned as the fast variant of Claude Opus 4.8 for lower-latency agentic and production workloads.

text-generationreasoninglong-context+1

1.0M Docs

Google·May 19, 2026

Gemini 3.5

Google’s Gemini 3.5 is a new frontier model series focused on combining strong general intelligence with agentic action/tool use, announced at Google I/O 2026.

reasoningtool-useagentic-workflows+3

N/A Docs

Google·May 19, 2026

Gemini 3.5 Flash

A fast, efficient Gemini 3.5-series model variant listed on OpenRouter, intended for low-latency agentic and general assistant workloads with a very large context window.

reasoningtool-useagentic-workflows+2

1.0M Docs

Anthropic·May 12, 2026

Claude Opus 4.7 Fast

A latency-optimised variant of Claude Opus 4.7 with a one-million-token context window, designed for real-time agentic workflows, dependency auditing, and large codebase analysis where Opus-class reasoning is required at lower response times.

reasoninglong-contexttool-use+3

1.0M$5/1M in Docs

OpenAI·May 5, 2026

GPT-5.5 Instant

An updated default ChatGPT model focused on smarter, more accurate responses with reduced hallucinations and improved personalization controls.

reasoningtext-generationcode-generation+1

N/A Docs

OpenAI·May 5, 2026

gpt-chat-latest

A ChatGPT-aligned OpenAI model alias newly added to OpenRouter with a 400k token context window, intended for general conversational and assistant-style use.

text-generationlong-contextinstruction-following+1

400K Docs

Mistral AI·Apr 30, 2026

Mistral Medium 3.5

A Mistral AI foundation model newly listed on OpenRouter with a 262k token context window, positioned as a balanced medium-tier model for general purpose generation and reasoning tasks.

text-generationreasoninglong-context+1

262K Docs

xAI·Apr 30, 2026

Grok 4.3

A new Grok-series flagship model variant listed on OpenRouter with a 1M-token context window, aimed at high-context general reasoning and assistant use.

reasoninglong-contextchat+2

1.0M Docs

Alibaba·Apr 27, 2026

Qwen3.6 Max (Preview)

A preview flagship Qwen3.6 foundation model variant aimed at strong general-purpose reasoning and instruction following with a large context window.

reasoningtool-usecode-generation+2

262K Docs

Alibaba·Apr 27, 2026

Qwen3.6 Flash

A speed-optimized Qwen3.6 foundation model for low-latency chat and agent workloads while retaining a very large context window.

long-contextinstruction-followingtool-use+2

1.0M Docs

DeepSeek·Apr 24, 2026

DeepSeek V4 Pro

DeepSeek’s V4 Pro foundation model listing with a 1M-token context window, intended for long-context reasoning and agentic workloads.

long-contextreasoningcode-generation+2

1.0M Docs

DeepSeek·Apr 24, 2026

DeepSeek V4 Flash

DeepSeek’s V4 Flash foundation model listing with a 1M-token context window, optimized for lower-latency long-context tasks.

long-contextreasoningcode-generation+2

1.0M Docs

OpenAI·Apr 23, 2026

GPT-5.5

OpenAI’s flagship GPT-5.5 model, positioned as faster and more capable for complex tasks like coding, research, and data analysis across tools.

reasoningcode-generationtool-use+3

N/A Docs

OpenAI·Apr 22, 2026

OpenAI Privacy Filter

An open-weight OpenAI model for detecting and redacting personally identifiable information (PII) in text, intended as a privacy/safety component in pipelines.

pii-detectiontext-redactioncompliance+1

N/AOpen Weight Docs

OpenAI·Apr 21, 2026

GPT-5.4 Image 2

An OpenAI multimodal model oriented around image understanding/generation workflows, listed on OpenRouter as a new GPT-5.4 image-capable offering with a large context window.

visionimage-generationmultimodal+2

272K Docs

Google·Apr 16, 2026

Nano Banana 2

An image generation model in the Gemini app that uses personal context and Google Photos to create more personalized images.

image-generationpersonalizationphoto-editing+1

N/A Docs

OpenAI·Apr 16, 2026

GPT-Rosalind

A frontier reasoning model for life sciences research, positioned to accelerate drug discovery workflows including genomics analysis and protein reasoning.

reasoninglife-sciencescode-generation+1

N/A Docs

Anthropic·Apr 16, 2026

Claude Opus 4.7

A new Claude Opus-series frontier model version listed on OpenRouter with a 1M-token context window, intended for high-end reasoning and long-context workloads.

reasoninglong-contexttool-use+3

1.0M$5/1M in Docs

Google·Apr 15, 2026

Gemini 3.1 Flash TTS

A text-to-speech model focused on next-generation expressive speech, now available across Google products.

text-to-speechspeech-generationexpressive-audio+1

N/A Docs

OpenAI·Apr 14, 2026

GPT-5.4-Cyber

A GPT-5.4-derived model introduced under OpenAI’s Trusted Access for Cyber program, intended for vetted cyber defenders with strengthened safeguards for cybersecurity use cases.

reasoningcybersecuritythreat-analysis+2

N/A Docs

Anthropic·Apr 7, 2026

Claude Opus 4.6 Fast

A faster variant of Claude Opus 4.6 exposed via OpenRouter, aimed at high-throughput production workloads while retaining the Opus-class capability profile.

reasoningtext-generationtool-use+2

1.0M Docs

Google·Apr 3, 2026

Gemma 4 26B A4B IT

An instruction-tuned Gemma 4 model listed on OpenRouter, positioned as a large open model for general-purpose chat and instruction following with a long context window.

text-generationinstruction-followingreasoning+2

262KOpen Weight Docs

Alibaba·Apr 2, 2026

Qwen3.6-Plus

A long-context Qwen model variant listed on OpenRouter, intended for general-purpose instruction following and long-document workloads.

text-generationinstruction-followinglong-context+2

1.0M Docs

Google·Apr 2, 2026

Gemma 4 31B IT

An instruction-tuned Gemma 4 family model offered via OpenRouter with a very large context window, aimed at general-purpose assistant and agentic workflows.

instruction-followingreasoningtool-use+2

262K Docs

Google·Mar 31, 2026

Veo 3.1 Lite

Cost-effective video generation model available in paid preview via the Gemini API and for testing in Google AI Studio.

video-generation

N/A Docs

Google·Mar 30, 2026

Lyria 3 Pro (Preview)

A preview Lyria 3 variant surfaced on OpenRouter, associated with Google’s Lyria music/audio generation stack for higher-end generation workflows.

audio-generationmusic-generationlong-context

1.0M Docs

Google·Mar 30, 2026

Lyria 3 CLIP (Preview)

A preview Lyria 3 variant listed on OpenRouter, likely intended for clip-based audio/music generation or related multimodal embedding workflows within the Lyria stack.

audio-generationmusic-generationclip-generation

1.0M Docs

Alibaba·Mar 30, 2026

Qwen3.6 Plus Preview

Preview release of Alibaba's Qwen 3.6 Plus model as listed on OpenRouter, offering a very large context window for general-purpose text tasks.

text-generationreasoninglong-context+1

1.0M Docs

Google·Mar 26, 2026

Gemini 3.1 Flash Live

A low-latency, live audio-capable Gemini Flash model designed for more natural, reliable real-time voice interactions across Google products.

audioreal-timemultimodal+2

N/A Docs

Google·Mar 25, 2026

Lyria 3

Google’s newest music generation model, available in paid preview through the Gemini API and for testing in Google AI Studio.

music-generationaudiocreative-generation

N/A Docs

Mistral AI·Mar 16, 2026

Mistral Small 2603

A new Mistral Small series release listed on OpenRouter with a 262k context window, positioned as a general-purpose foundation model for long-context workloads.

long-contextreasoningtext-generation+2

262K Docs

xAI·Mar 12, 2026

Grok 4.20 (Beta)

A Grok 4.20 beta model offering a very large (2M token) context window for long-context general-purpose chat and reasoning workloads.

long-contextreasoningchat+2

2.0M Docs

xAI·Mar 12, 2026

Grok 4.20 Multi-Agent (Beta)

A Grok 4.20 beta variant positioned for multi-agent workflows, with a 2M token context window for coordinating longer multi-step tasks.

long-contextreasoningagentic+2

2.0M Docs

NVIDIA·Mar 11, 2026

NVIDIA Nemotron 3 Super (120B, A12B)

An open model from NVIDIA designed for scalable agentic AI, described as a 120B-parameter model with 12B active parameters and optimized throughput.

reasoningagenticlong-context+2

262KOpen Weight Docs

Alibaba·Mar 10, 2026

Qwen3.5-9B

A 9B-parameter Qwen3.5 foundation model with a large (262k token) context window, positioned for general chat and reasoning with long-context inputs.

chatreasoninglong-context+2

262K Docs

OpenAI·Mar 5, 2026

GPT-5.4

OpenAI frontier foundation model positioned as more capable and efficient for professional work, with state-of-the-art coding, computer use, and tool search, plus a 1M-token context window.

reasoningcode-generationtool-use+3

1.1M Docs

OpenAI·Mar 5, 2026

GPT-5.4 Pro

Higher-tier GPT-5.4 offering listed by OpenRouter, providing a 1M-token context window for advanced professional and agentic workloads.

reasoningcode-generationtool-use+3

1.1M Docs

OpenAI·Mar 3, 2026

GPT-5.3 Instant

Conversation-focused GPT-5.3 variant announced by OpenAI for smoother, more useful everyday chat interactions.

chatreasoningsummarization+1

128K Docs

Google·Mar 3, 2026

Gemini 3.1 Flash-Lite

Google’s fastest and most cost-efficient Gemini 3 series model, built for intelligence at scale.

reasoningchattool-use+2

1.0M Docs

Google·Feb 26, 2026

Gemini 3.1 Flash Image (Preview)

Google's Flash-speed image generation and editing model referenced as "Nano Banana 2" and listed on OpenRouter as a Gemini 3.1 Flash Image preview.

image-generationimage-editingmultimodal

66K Docs

Google·Feb 25, 2026

Gemini 3.1 Pro Preview (Custom Tools)

A Gemini 3.1 Pro preview variant listed on OpenRouter that is explicitly labeled for custom tools, suggesting enhanced tool-use integration with a very large context window.

tool-usereasoninglong-context

1.0M Docs

Alibaba·Feb 25, 2026

Qwen3.5 Flash 02-23

A Qwen3.5 Flash model snapshot (02-23) newly listed on OpenRouter with a 1M-token context window, positioned for fast, long-context inference.

long-contextreasoning

1.0M Docs

Alibaba·Feb 25, 2026

Qwen3.5 122B A10B

A large Qwen3.5 Mixture-of-Experts-style model variant newly added on OpenRouter, offering a large 262k-token context window.

reasoninglong-context

262K Docs

Alibaba·Feb 25, 2026

Qwen3.5 35B A3B

A Qwen3.5 model variant newly listed on OpenRouter with a 262k-token context window, intended as a mid-sized foundation option in the Qwen3.5 family.

reasoninglong-context

262K Docs

Alibaba·Feb 25, 2026

Qwen3.5 27B

A Qwen3.5 27B foundation model newly added on OpenRouter, providing a 262k-token context window for general assistant workloads.

reasoninglong-context

262K Docs

OpenAI·Feb 24, 2026

GPT-5.3 Codex

A new Codex-branded GPT-5.3 model intended for code-centric use cases, listed as newly added on OpenRouter with a large context window.

code-generationreasoning

400K Docs

Google·Feb 19, 2026

Gemini 3.1 Pro Preview

Preview release of Google's Gemini 3.1 Pro model with a very large context window, aimed at advanced general-purpose reasoning and long-context workloads.

reasoninglong-contexttool-use

1.0M Docs

Alibaba·Feb 16, 2026

Qwen3.5-Plus-02-15

Alibaba Qwen 3.5 'Plus' model variant as listed on OpenRouter, featuring a 1M-token context window for long-context general-purpose generation and analysis.

reasoninglong-contextcode-generation

1.0M Docs

Alibaba·Feb 16, 2026

Qwen3.5-397B-A17B

Large-scale Qwen 3.5 model (397B with A17B MoE-style routing indicated by the name) added on OpenRouter, intended for high-end reasoning and generation with a 262K context window.

reasoninglong-contextcode-generation

262K Docs

Google·Feb 15, 2026

Gemini 3.1 Pro

Advanced intelligence with complex problem-solving, agentic and vibe coding capabilities

reasoningcode-generationagentic-coding+3

2.0M$3/1M in Docs

xAI·Feb 15, 2026

Grok 420

xAI's most advanced model with breakthrough capabilities (early access)

reasoningcode-generationagentic-tasks+2

1.0M$15/1M in Docs

xAI·Feb 15, 2026

Grok 420 Multi-Agent

Grok 420 variant optimized for multi-agent orchestration

reasoningmulti-agentagentic-tasks+1

1.0M$20/1M in Docs

Google·Feb 10, 2026

Gemini 3.0 Pro

Latest Gemini Pro with enhanced reasoning and coding capabilities across all modalities

reasoningcode-generationcode-review+3

2.0M$2/1M in Docs

Anthropic·Feb 1, 2026

Claude 4.6 Opus

Latest flagship Anthropic model with state-of-the-art reasoning, coding expertise, and agentic capabilities

reasoningcode-generationcode-review+5

1.0M$25/1M in Docs

Anthropic·Feb 1, 2026

Claude 4.6 Sonnet

Most advanced Claude Sonnet with exceptional coding and reasoning, ideal balance of capability and efficiency

code-generationcode-reviewanalysis+4

500K$5/1M in Docs

Anthropic·Feb 1, 2026

Claude 4.6 Haiku

Ultra-fast Claude 4.6 model for real-time applications and high-volume processing

code-generationquick-analysisfunction-calling+1

200K$0.6/1M in Docs

OpenAI·Feb 1, 2026

GPT-5.2 Pro

Most capable GPT-5.2 variant producing smarter and more precise responses

reasoningcode-generationagentic-tasks+3

256K$20/1M in Docs

Google·Jan 20, 2026

Gemini 3.0 Flash

Next-generation fast model with improved efficiency and multimodal capabilities

code-generationanalysisvision+2

2.0M$0.15/1M in Docs

OpenAI·Jan 20, 2026

GPT-5.2 Codex

Most intelligent coding model optimized for long-horizon agentic coding tasks

code-generationcode-refactoringagentic-coding+2

256K$12/1M in Docs

Google·Jan 20, 2026

Gemini 3 Pro

Google's state-of-the-art reasoning model with advanced multimodal understanding

reasoningcode-generationvision+2

2.0M$2.5/1M in Docs

xAI·Jan 15, 2026

Grok 4

Latest iteration of xAI's flagship model with breakthrough performance

reasoningcode-generationcomplex-analysis+2

500K$8/1M in Docs

xAI·Jan 15, 2026

Grok 4 Mini

Efficient version of Grok 4 optimized for speed and cost-effectiveness

code-generationanalysisfunction-calling

256K$1.5/1M in Docs

OpenAI·Jan 15, 2026

GPT-5.2

OpenAI's best model for coding and agentic tasks across industries

reasoningcode-generationagentic-tasks+3

256K$10/1M in Docs

Anthropic·Jan 15, 2026

Claude Opus 4.6

The most intelligent Claude model for building agents and coding with extended thinking

reasoningcode-generationagentic-tasks+3

1.0M$5/1M in Docs

Anthropic·Jan 15, 2026

Claude Sonnet 4.6

Best combination of speed and intelligence with extended thinking support

code-generationreasoningextended-thinking+3

1.0M$3/1M in Docs

Google·Jan 10, 2026

Gemini 3 Flash

Frontier-class performance rivaling larger models at a fraction of the cost

code-generationanalysisvision+2

2.0M$0.2/1M in Docs

xAI·Jan 1, 2026

Grok 4 Voice

Grok 4 with real-time voice conversation capabilities

voicereal-timeconversation+1

256K$0/1M in Docs

Alibaba·Jan 1, 2026

Qwen 3 Coder 235B

Alibaba's largest and most capable coding model

code-generationcode-reviewdebugging+2

256KOpen Weight Docs

OpenAI·Dec 1, 2025

GPT-5

Next-generation GPT model (announced for 2025)

multimodalreasoningcode-generation+1

256K Docs

Alibaba·Dec 1, 2025

Qwen Coder 3 72B

Alibaba's latest flagship coding model with exceptional performance

code-generationcode-reviewdebugging+2

256KOpen Weight Docs

OpenAI·Dec 1, 2025

GPT-OSS 120B

OpenAI's most powerful open-weight model, fits on H100 GPU

code-generationreasoninganalysis+1

128KOpen Weight Docs

OpenAI·Dec 1, 2025

GPT-OSS 20B

Medium-sized open-weight model for low latency

code-generationanalysis

64KOpen Weight Docs

Google·Dec 1, 2025

Gemini Deep Research

Agentic model for autonomous multi-step research across hundreds of sources

researchanalysissynthesis+2

1.0M$5/1M in Docs

Meta·Dec 1, 2025

Llama 4 Coder 405B

Meta's most capable code model based on Llama 4 architecture

code-generationcode-reviewdebugging+2

256KOpen Weight Docs

Meta·Dec 1, 2025

Llama 4 Coder 70B

Efficient Llama 4 coding variant for production use

code-generationcode-reviewdebugging

256KOpen Weight Docs

Google·Nov 15, 2025

Gemini 2.5 Ultra

Google's most powerful model for demanding enterprise tasks and complex reasoning

reasoningcode-generationcomplex-analysis+3

2.0M$10/1M in Docs

OpenAI·Nov 15, 2025

GPT-5.1 Codex Mini

Cost-effective smaller version of GPT-5.1 Codex

code-generationcode-completionquick-fixes

128K$3/1M in Docs

xAI·Nov 1, 2025

Grok 3.5

xAI's advanced model with improved reasoning and real-time knowledge integration

reasoningcode-generationreal-time-knowledge+1

256K$5/1M in Docs

OpenAI·Nov 1, 2025

GPT-5.1 Codex Max

GPT-5.1 Codex optimized for long-running coding tasks

code-generationagentic-codinglong-running-tasks+1

512K$15/1M in Docs

Zhipu AI·Nov 1, 2025

CodeGeeX 5

Latest multilingual code generation model with enhanced capabilities

code-generationcode-completionmulti-language+1

66KOpen Weight Docs

Anthropic·Oct 15, 2025

Claude 4.5 Opus

Anthropic's most capable model with breakthrough reasoning, extended thinking, and exceptional coding abilities

reasoningcode-generationcode-review+4

500K$20/1M in Docs

Anthropic·Oct 15, 2025

Claude 4.5 Sonnet

High-performance Claude model balancing intelligence and speed, excels at code generation and analysis

code-generationcode-reviewanalysis+3

500K$4/1M in Docs

Anthropic·Oct 15, 2025

Claude 4.5 Haiku

Fastest Claude 4.5 model optimized for quick tasks and high-throughput applications

code-generationquick-analysisfunction-calling+1

200K$0.5/1M in Docs

OpenAI·Oct 1, 2025

GPT-5.1 Codex

GPT-5.1 optimized for agentic coding in Codex environment

code-generationagentic-codingcode-review+2

256K$10/1M in Docs

Anthropic·Oct 1, 2025

Claude Haiku 4.5

Fastest Claude model with near-frontier intelligence and extended thinking

code-generationextended-thinkingvision+1

200K$1/1M in Docs

Google·Oct 1, 2025

Gemini Computer Use

Specialized model for UI automation - clicking, typing, and navigating browser tasks

computer-useui-automationbrowser-control+1

256K$3/1M in Docs

OpenAI·Sep 15, 2025

GPT-5.1

Intelligent reasoning model for coding and agentic tasks with configurable reasoning effort

reasoningcode-generationagentic-tasks+2

256K$8/1M in Docs

Google·Sep 1, 2025

Gemini 2.5 Pro Thinking

Google's most advanced reasoning model with extended chain-of-thought capabilities

reasoningcode-generationcomplex-analysis+3

2.0M$3.5/1M in Docs

BigCode·Sep 1, 2025

StarCoder3 32B

Next-generation open-source code LLM with improved capabilities

code-generationcode-completionmulti-language

33KOpen Weight Docs

GitHub·Sep 1, 2025

GitHub Copilot Workspace

Agentic AI for complex multi-file development tasks

agentic-codingmulti-file-editingcode-generation+1

256K Docs

Google·Aug 1, 2025

Gemini Code

Specialized coding model optimized for software development and code understanding

code-generationcode-reviewdebugging+2

1.0M$1.5/1M in Docs

xAI·Aug 1, 2025

Grok Vision

Multimodal Grok model with advanced image and document understanding

visioncode-generationdocument-analysis+1

128K$3/1M in Docs

OpenAI·Aug 1, 2025

GPT-5 Codex

GPT-5 optimized for agentic coding in Codex

code-generationagentic-codingdebugging+1

256K$8/1M in Docs

Google·Aug 1, 2025

Gemini 2.5 Flash-Lite

Fastest and most budget-friendly multimodal model in the Gemini 2.5 family

code-generationanalysisvision

1.0M$0.05/1M in Docs

IBM·Aug 1, 2025

Granite Code 3 34B

IBM's latest enterprise code model with enhanced security awareness

code-generationcode-reviewsecurity-analysis+1

33KOpen Weight Docs

OpenAI·Jul 1, 2025

o4-mini

Next-generation compact reasoning model

reasoningcode-generationmath

200K Docs

OpenAI·Jul 1, 2025

GPT-5 Pro

GPT-5 variant producing smarter and more precise responses

reasoningcode-generationcomplex-analysis+1

256K$12/1M in Docs

OpenAI·Jul 1, 2025

GPT-5 Nano

Fastest, most cost-efficient version of GPT-5

code-generationquick-analysis

64K$0.3/1M in Docs

Open Source·Jul 1, 2025

OlympicCoder 32B

Competition-grade code model fine-tuned on competitive programming

code-generationalgorithm-designproblem-solving

33KOpen Weight Docs

OpenAI·Jun 15, 2025

GPT-5 Mini

Faster, cost-efficient version of GPT-5 for well-defined tasks

code-generationanalysisfunction-calling

128K$1.5/1M in Docs

DeepSeek·Jun 1, 2025

DeepSeek Coder V3

Latest DeepSeek coding model with state-of-the-art code understanding

code-generationcode-reviewdebugging+2

256KOpen Weight Docs

Mistral AI·Jun 1, 2025

Mistral Large Code

Mistral's flagship model optimized for enterprise coding tasks

code-generationcode-reviewarchitecture-design+1

256K$3/1M in Docs

GitHub·Jun 1, 2025

GitHub Copilot Chat

Conversational AI for coding powered by GPT-5

code-generationchatcode-explanation+1

128K Docs

Anthropic·May 22, 2025

Claude 4 Opus

Most capable Claude model with extended thinking

extended-thinkingcode-generationdeep-analysis+1

200K Docs

Anthropic·May 22, 2025

Claude 4 Sonnet

Balanced Claude 4 model with strong coding abilities

code-generationanalysisreasoning+1

200K Docs

Anthropic·May 22, 2025

Claude 4 Haiku

Fast and efficient Claude 4 model

code-generationanalysisfast-inference

200K Docs

Anthropic·May 22, 2025

Claude Opus 4

Latest flagship Claude model with superior reasoning

deep-reasoningcode-generationanalysis+1

200K Docs

Anthropic·May 22, 2025

Claude Sonnet 4

Balanced Claude 4 model optimized for coding

code-generationreasoninganalysis

200K Docs

OpenAI·May 15, 2025

o4-mini Deep Research

Cost-efficient deep research model

reasoningresearchanalysis+1

500K$5/1M in Docs

Mistral AI·May 1, 2025

Devstral

Mistral's agentic coding model for complex development tasks

code-generationagentic-codingdebugging+1

256K$2/1M in Docs

Alibaba·Apr 28, 2025

Qwen 3 235B

Latest flagship Qwen model with MoE architecture

code-generationreasoningmultilingual+1

131KOpen Weight Docs

Alibaba·Apr 28, 2025

Qwen 3 32B

Balanced Qwen 3 model for diverse tasks

code-generationreasoninganalysis

131KOpen Weight Docs

Alibaba·Apr 28, 2025

Qwen 3 8B

Efficient Qwen 3 model for quick tasks

code-generationchatanalysis

131KOpen Weight Docs

Google·Apr 17, 2025

Gemini 2.5 Flash

Fast and efficient Gemini 2.5 model with thinking

reasoningcode-generationfast-inference+1

1.0M Docs

OpenAI·Apr 14, 2025

GPT-4.1

Optimized GPT-4 variant with improved coding and instruction following

code-generationlong-contextinstruction-following+1

1.0M$2/1M in Docs

OpenAI·Apr 14, 2025

GPT-4.1 mini

Cost-effective version of GPT-4.1 for everyday tasks

code-generationlong-contextanalysis

1.0M$0.4/1M in Docs

OpenAI·Apr 14, 2025

GPT-4.1 nano

Smallest and fastest GPT-4.1 variant for quick tasks

code-generationsimple-analysisfast-inference

1.0M$0.1/1M in Docs

Meta·Apr 5, 2025

Llama 4 Scout

Llama 4 variant optimized for efficient multi-turn tasks

long-contextcode-generationreasoning+1

10.0MOpen Weight Docs

Meta·Apr 5, 2025

Llama 4 Maverick

Llama 4 variant for complex reasoning and coding

code-generationreasoningplanning+1

1.0MOpen Weight Docs

OpenAI·Apr 1, 2025

o3 Deep Research

o3 optimized for multi-step deep research tasks

reasoningresearchanalysis+2

500K$20/1M in Docs

Meta·Apr 1, 2025

Code Llama 3 70B

Meta's latest Code Llama based on Llama 3 architecture

code-generationcode-completiondebugging+1

131KOpen Weight Docs

Meta·Apr 1, 2025

Code Llama 3 8B

Efficient Code Llama 3 for local development

code-generationcode-completion

131KOpen Weight Docs

Google·Mar 25, 2025

Gemini 2.5 Pro

Latest Gemini model with enhanced thinking capabilities

deep-reasoningcode-generationmultimodal+1

1.0M Docs

Meta·Mar 15, 2025

Llama 3.3 Coder 70B

Meta's latest code-specialized Llama model with enhanced coding capabilities

code-generationcode-reviewdebugging+2

131KOpen Weight Docs

Cohere·Mar 13, 2025

Command A

Latest flagship model optimized for enterprise tasks

ragcode-generationreasoning+2

256K Docs

OpenAI·Mar 1, 2025

o3 Pro

o3 with more compute for better, more thorough responses

reasoningcode-generationcomplex-analysis+1

200K$30/1M in Docs

OpenAI·Feb 27, 2025

GPT-4.5 Preview

Next-generation GPT model with enhanced reasoning and multimodal capabilities

reasoningcode-generationvision+2

128K$75/1M in Docs

Microsoft·Feb 26, 2025

Phi-4-mini

Compact Phi-4 for efficient deployment

code-generationreasoningfunction-calling

128KOpen Weight Docs

Anthropic·Feb 24, 2025

Claude 3.5 Opus

Enhanced Opus model with superior reasoning

deep-reasoningcode-generationcomplex-analysis

200K Docs

xAI·Feb 17, 2025

Grok-3

Next-generation Grok with enhanced reasoning

deep-reasoningcode-generationanalysis+1

131K Docs

xAI·Feb 17, 2025

Grok-3 mini

Efficient Grok-3 with thinking capabilities

reasoningcode-generationthinking+1

131K Docs

Mistral AI·Feb 15, 2025

Codestral 25.02

Latest Mistral coding model with enhanced performance

code-generationcode-reviewdebugging+2

256K$1.2/1M in Docs

Google·Feb 5, 2025

Gemini 2.0 Pro

Advanced Gemini 2.0 model for complex reasoning tasks

reasoningcode-generationmultimodal+1

2.0M Docs

Mistral AI·Feb 3, 2025

Mistral Saba

Expert model for Middle Eastern and South Asian languages

multilingualcode-generationregional-expertise

33K Docs

Amazon·Feb 3, 2025

Amazon Nova Premier

Most capable Nova model for complex reasoning

deep-reasoningcode-generationanalysis+1

1.0M Docs

DeepSeek·Feb 1, 2025

DeepSeek R1 Coder

DeepSeek's reasoning model specialized for complex coding tasks

code-generationreasoningcode-review+2

256KOpen Weight Docs

OpenAI·Jan 31, 2025

o3-mini

Next-generation reasoning model with improved efficiency (announced)

reasoningcode-generationplanning+1

200K Docs

OpenAI·Jan 31, 2025

o3

Full o3 reasoning model for frontier problem solving

deep-reasoningcode-generationmath+2

200K Docs

OpenAI·Jan 31, 2025

o3 High

High compute version of o3 for maximum reasoning depth

deep-reasoningcode-generationmath+1

200K Docs

Mistral AI·Jan 30, 2025

Mistral Small 3

Latest small model with enhanced capabilities

code-generationreasoningfunction-calling

33K$0.1/1M in Docs

NVIDIA·Jan 23, 2025

Llama 3.3 70B Nemotron

NVIDIA-optimized Llama 3.3 for enterprise

code-generationreasoninganalysis+1

128KOpen Weight Docs

Google·Jan 21, 2025

Gemini 2.0 Flash Thinking

Flash model with explicit reasoning for complex tasks

reasoningcode-generationanalysis+1

1.0M Docs

DeepSeek·Jan 20, 2025

DeepSeek R1

Reasoning model with chain-of-thought capabilities

deep-reasoningmathcode-generation+1

128K$0.55/1M in Docs

DeepSeek·Jan 20, 2025

DeepSeek R1 Distill Qwen 32B

Distilled R1 model based on Qwen for efficient reasoning

reasoningcode-generationmath

128KOpen Weight Docs

DeepSeek·Jan 20, 2025

DeepSeek R1 Distill Llama 70B

Distilled R1 model based on Llama 70B

reasoningcode-generationanalysis

128KOpen Weight Docs

DeepSeek·Jan 20, 2025

DeepSeek Reasoner

API-accessible reasoning model based on R1

deep-reasoningmathcode-generation

128K$0.55/1M in Docs

DeepSeek·Jan 20, 2025

DeepSeek R1 Distill Qwen 7B

Compact distilled reasoning model

reasoningcode-generationmath

128KOpen Weight Docs

DeepSeek·Jan 20, 2025

DeepSeek R1 Distill Qwen 1.5B

Ultra-compact reasoning model

reasoningcode-generation

128KOpen Weight Docs

DeepSeek·Jan 20, 2025

DeepSeek R1 Distill Llama 8B

Efficient Llama-based reasoning model

reasoningcode-generation

128KOpen Weight Docs

Mistral AI·Jan 15, 2025

Codestral 2501

Latest Mistral coding model with improved performance and longer context

code-generationcode-reviewdebugging+2

256K$1/1M in Docs

DeepSeek·Dec 25, 2024

DeepSeek V3

MoE model with 671B parameters achieving frontier performance

code-generationreasoningmath+1

128K$0.27/1M in Docs

LG AI Research·Dec 19, 2024

EXAONE 3.5 32B

Korean-English bilingual model from LG

bilingualcode-generationreasoning

33KOpen Weight Docs

LG AI Research·Dec 19, 2024

EXAONE 3.5 7.8B

Efficient Korean-English model

bilingualchatcode-generation

33KOpen Weight Docs

Microsoft·Dec 12, 2024

Phi-4

Latest Phi model with state-of-the-art reasoning

code-generationreasoningmath+1

16KOpen Weight Docs

Google·Dec 11, 2024

Gemini 2.0 Flash

Next-generation multimodal model with native tool use and agentic capabilities

code-generationmultimodaltool-use+1

1.0M$0.075/1M in Docs

Technology Innovation Institute·Dec 11, 2024

Falcon 3 10B

Latest Falcon 3 model for efficient deployment

code-generationreasoninganalysis

33KOpen Weight Docs

Meta·Dec 6, 2024

Llama 3.3 70B

Open-weight multilingual model matching Llama 3.1 405B performance

code-generationcode-translationmultilingual

128KOpen Weight Docs

OpenAI·Dec 5, 2024

o1

Reasoning model designed to solve hard problems across domains using chain-of-thought

reasoningcode-generationcomplex-analysis+1

200K$15/1M in Docs

OpenAI·Dec 5, 2024

o1 Pro

Pro version of o1 with extended compute for harder problems

deep-reasoningcomplex-analysiscode-generation+1

200K Docs

Amazon·Dec 3, 2024

Amazon Nova Micro

Fastest and most cost-effective Nova model

text-generationclassificationchat

128K$0.035/1M in Docs

Amazon·Dec 3, 2024

Amazon Nova Lite

Multimodal Nova model for image and video understanding

multimodalvisionvideo-understanding+1

300K$0.06/1M in Docs

Amazon·Dec 3, 2024

Amazon Nova Pro

Balanced Nova model for most tasks

multimodalreasoningcode-generation+1

300K$0.8/1M in Docs

Alibaba·Nov 27, 2024

QwQ 32B

Reasoning-focused model from Qwen family

deep-reasoningmathcode-generation+1

33KOpen Weight Docs

Skywork·Nov 25, 2024

Skywork o1 Open 8B

Open reasoning model following o1 methodology

reasoningmathcode-generation

33KOpen Weight Docs

Allen AI·Nov 22, 2024

Tulu 3 405B

Fine-tuned Llama 3.1 405B for instruction following

code-generationreasoninginstruction-following

128KOpen Weight Docs

Allen AI·Nov 22, 2024

Tulu 3 70B

Efficient Tulu model for balanced tasks

code-generationreasoninganalysis

128KOpen Weight Docs

Alibaba·Nov 22, 2024

Marco-o1

Reasoning model inspired by o1 methodology

reasoningmathcode-generation+1

33KOpen Weight Docs

Mistral AI·Nov 18, 2024

Pixtral Large

Large multimodal model for complex visual tasks

visioncode-generationreasoning+1

128K Docs

Mistral AI·Nov 18, 2024

Mistral Large 2411

Latest Mistral Large with system prompt improvements

code-generationreasoningfunction-calling+1

128K$2/1M in Docs

Nexusflow·Nov 12, 2024

Athene V2 Chat 72B

Qwen-based model optimized for chat and reasoning

chatreasoningcode-generation+1

131KOpen Weight Docs

Alibaba·Nov 11, 2024

Qwen 2.5 Coder 32B

State-of-the-art open code model rivaling GPT-4o on coding tasks

code-generationcode-completioncode-reasoning

131KOpen Weight Docs

Alibaba·Nov 11, 2024

Qwen 2.5 Coder 7B

Efficient coding model from Qwen 2.5 family

code-generationcode-completioncode-reasoning

131KOpen Weight Docs

Alibaba·Nov 11, 2024

Qwen Coder 2.5 32B

Alibaba's specialized coding model with strong code understanding capabilities

code-generationcode-reviewdebugging+1

131KOpen Weight Docs

Alibaba·Nov 11, 2024

Qwen Coder 2.5 14B

Balanced code model with strong performance and reasonable resource requirements

code-generationcode-reviewdebugging

131KOpen Weight Docs

Alibaba·Nov 11, 2024

Qwen Coder 2.5 7B

Efficient code model for quick tasks and resource-constrained environments

code-generationcode-completion

131KOpen Weight Docs

Infinigence AI·Nov 6, 2024

Megrez 3B

Efficient model designed for edge deployment

code-generationchatreasoning

128KOpen Weight Docs

Tencent·Nov 5, 2024

Hunyuan-Large

Tencent's large MoE model

code-generationreasoninganalysis+1

256KOpen Weight Docs

Anthropic·Nov 4, 2024

Claude 3.5 Haiku

Fast and affordable model for high-volume tasks

code-generationcode-translationquick-analysis

200K$0.8/1M in Docs

Allen AI·Nov 4, 2024

OLMo 2 13B

Fully open model with training data available

text-generationreasoningresearch

4KOpen Weight Docs

Allen AI·Nov 4, 2024

OLMo 2 7B

Efficient fully open model

text-generationanalysisresearch

4KOpen Weight Docs

Hugging Face·Nov 1, 2024

SmolLM2 1.7B

Compact model for on-device deployment

chatcode-generationsummarization

8KOpen Weight Docs

Hugging Face·Nov 1, 2024

SmolLM2 360M

Tiny model for ultra-constrained environments

chatclassificationsimple-tasks

8KOpen Weight Docs

Codeium·Nov 1, 2024

Windsurf Cascade

Agentic AI for autonomous coding with deep codebase understanding

agentic-codingcodebase-understandingrefactoring

100K Docs

Recraft·Oct 29, 2024

Recraft V3

Professional image generation for design

image-generationvector-graphicsdesign

N/A Docs

Cohere·Oct 23, 2024

Aya Expanse 32B

Multilingual model supporting 23 languages

multilingualcode-generationtranslation

128KOpen Weight Docs

Cohere·Oct 23, 2024

Aya Expanse 8B

Efficient multilingual model

multilingualchattranslation

128KOpen Weight Docs

Anthropic·Oct 22, 2024

Claude 3.5 Sonnet

Most intelligent Claude model, excels at coding and complex reasoning

code-generationcode-translationanalysis+2

200K$3/1M in Docs

Stability AI·Oct 22, 2024

Stable Diffusion 3.5

Latest text-to-image generation model

image-generationtext-to-image

N/AOpen Weight Docs

Anthropic·Oct 22, 2024

Claude Computer Use

Claude model specialized for computer control and automation

computer-useui-automationbrowser-control+1

200K$3/1M in Docs

IBM·Oct 21, 2024

Granite 3 8B

IBM's efficient enterprise model

code-generationreasoningenterprise+1

128KOpen Weight Docs

IBM·Oct 21, 2024

Granite 3 2B

Compact IBM model for edge deployment

code-generationchatenterprise

128KOpen Weight Docs

Mistral AI·Oct 16, 2024

Ministral 8B

Edge-focused model for on-device deployment

code-generationreasoningedge-ai

128KOpen Weight Docs

Mistral AI·Oct 16, 2024

Ministral 3B

Smallest Ministral for ultra-efficient tasks

chatclassificationsimple-tasks

128KOpen Weight Docs

NVIDIA·Oct 11, 2024

Llama 3.1 Nemotron 70B

NVIDIA-optimized Llama 3.1 for enterprise

code-generationreasoningenterprise

128KOpen Weight Docs

Udio·Oct 10, 2024

Udio v1.5

Music generation with high fidelity

music-generationaudio-creation

N/A Docs

OpenAI·Oct 1, 2024

Whisper Large v3 Turbo

Fast speech recognition model

speech-to-textfast-transcriptionmultilingual

N/AOpen Weight Docs

Black Forest Labs·Oct 1, 2024

FLUX 1.1 Pro

High-quality image generation model

image-generationtext-to-imagefast-generation

N/A Docs

Meta·Sep 25, 2024

Llama 3.2 1B

Tiny Llama model for edge and mobile deployment

summarizationinstruction-followingchat

128KOpen Weight Docs

Meta·Sep 25, 2024

Llama 3.2 3B

Compact Llama model for efficient deployment

code-generationsummarizationchat

128KOpen Weight Docs

Meta·Sep 25, 2024

Llama 3.2 11B Vision

Multimodal Llama with vision capabilities

visioncode-generationanalysis

128KOpen Weight Docs

Meta·Sep 25, 2024

Llama 3.2 90B Vision

Large multimodal Llama with vision

visioncode-generationanalysis+1

128KOpen Weight Docs

Allen AI·Sep 25, 2024

Molmo 72B

Multimodal model for vision and language tasks

visionimage-understandinganalysis

4KOpen Weight Docs

Meta·Sep 25, 2024

Llama 3.2 Vision (General)

Multimodal Llama with image understanding

visioncode-generationanalysis

128KOpen Weight Docs

Alibaba·Sep 19, 2024

Qwen 2.5 72B

Largest Qwen 2.5 model for complex tasks

code-generationreasoningmultilingual+1

131KOpen Weight Docs

Alibaba·Sep 19, 2024

Qwen 2.5 7B

Efficient Qwen 2.5 for everyday tasks

code-generationchatanalysis

131KOpen Weight Docs

Alibaba·Sep 19, 2024

Qwen 2.5 14B

Mid-size Qwen 2.5 for balanced tasks

code-generationreasoninganalysis

131KOpen Weight Docs

Alibaba·Sep 19, 2024

Qwen 2.5 32B

Large Qwen 2.5 for complex tasks

code-generationreasoninganalysis+1

131KOpen Weight Docs

Voyage AI·Sep 18, 2024

Voyage 3

State-of-the-art embedding model

embeddingssemantic-searchrag

32K Docs

Voyage AI·Sep 18, 2024

Voyage Code 3

Code-specialized embedding model

code-embeddingscode-searchcode-similarity

32K Docs

Jina AI·Sep 18, 2024

Jina Embeddings v3

Multi-task embedding model with matryoshka support

embeddingsmultilingualmatryoshka

8KOpen Weight Docs

Mistral AI·Sep 17, 2024

Pixtral 12B

Multimodal model with vision capabilities

visioncode-generationimage-understanding

128KOpen Weight Docs

OpenAI·Sep 12, 2024

o1-mini

Fast reasoning model optimized for coding, math, and science

reasoningcode-generationdebugging

128K$3/1M in Docs

OpenAI·Sep 12, 2024

o1-preview

Preview version of OpenAI's reasoning model

reasoningcode-generationmath+1

128K$15/1M in Docs

HyperWrite·Sep 5, 2024

Reflection 70B

Self-correcting model trained on synthetic data

self-correctionreasoningcode-generation

8KOpen Weight Docs

01.AI·Sep 4, 2024

Yi Coder 9B

Efficient open code model with strong multilingual support

code-generationcode-completionmulti-language

131KOpen Weight Docs

01.AI·Sep 4, 2024

Yi Coder 1.5B

Ultra-efficient code model for edge deployment and quick tasks

code-generationcode-completion

131KOpen Weight Docs

01.AI·Sep 1, 2024

Yi Lightning

Fast Yi model for quick responses

chatcode-generationanalysis

16K Docs

Cohere·Sep 1, 2024

Command Code

Cohere's enterprise code model for development tasks

code-generationcode-reviewdebugging

128K$1/1M in Docs

AI21 Labs·Aug 22, 2024

Jamba 1.5 Large

Hybrid SSM-Transformer for long context

long-contextcode-generationreasoning

256KOpen Weight Docs

AI21 Labs·Aug 22, 2024

Jamba 1.5 Mini

Efficient hybrid model for quick tasks

long-contextcode-generationchat

256KOpen Weight Docs

Nous Research·Aug 20, 2024

Hermes 3 Llama 3.1 405B

Fine-tuned Llama 3.1 405B for instruction following

code-generationreasoningfunction-calling+1

128KOpen Weight Docs

Nous Research·Aug 20, 2024

Hermes 3 Llama 3.1 70B

Fine-tuned Llama 3.1 70B with enhanced capabilities

code-generationreasoningfunction-calling

128KOpen Weight Docs

Ideogram·Aug 20, 2024

Ideogram 2

Image model with excellent text rendering

image-generationtext-in-imagelogos

N/A Docs

Hugging Face·Aug 15, 2024

Parler TTS Large

Open-source controllable TTS

text-to-speechcontrollable-generation

N/AOpen Weight Docs

xAI·Aug 13, 2024

Grok-2

Latest Grok model with frontier capabilities

code-generationreasoningvision+1

128K Docs

xAI·Aug 13, 2024

Grok-2 mini

Efficient Grok-2 variant for faster inference

code-generationreasoningchat

128K Docs

Google·Aug 13, 2024

Imagen 3

Google's latest image generation model

image-generationphotorealistictext-to-image

N/A Docs

Cohere·Aug 1, 2024

c4ai-command-r-08-2024

Latest Command R with RAG optimizations

ragcode-generationtool-use+1

128KOpen Weight Docs

Black Forest Labs·Aug 1, 2024

FLUX.1 [dev]

Open-weight image model for development

image-generationtext-to-image

N/AOpen Weight Docs

Mistral AI·Jul 24, 2024

Mistral Large 2

Flagship model with 128k context and function calling

code-generationfunction-callingmultilingual+1

128K$2/1M in Docs

Meta·Jul 23, 2024

Llama 3.1 405B

Largest open-weight model with frontier-class capabilities

code-generationcode-translationcomplex-reasoning

128KOpen Weight Docs

Meta·Jul 23, 2024

Llama 3.1 8B

Extended context Llama 3.1 8B model

code-generationchatanalysis

128KOpen Weight Docs

Meta·Jul 23, 2024

Llama 3.1 70B

Extended context Llama 3.1 70B model

code-generationreasoninganalysis

128KOpen Weight Docs

OpenAI·Jul 18, 2024

GPT-4o Mini

Affordable small model for fast, lightweight tasks

code-generationcode-translationanalysis+1

128K$0.15/1M in Docs

Mistral AI·Jul 18, 2024

Mistral Nemo

Small but capable model for efficient deployment

code-generationreasoningmultilingual

128KOpen Weight Docs

Mistral AI·Jul 16, 2024

Codestral Mamba

Mamba-architecture code model for unlimited context

code-generationcode-completionlong-context

N/AOpen Weight Docs

ElevenLabs·Jul 15, 2024

ElevenLabs Turbo v2.5

Fast text-to-speech model

text-to-speechvoice-cloningfast-synthesis

N/A Docs

Zhipu AI·Jul 5, 2024

CodeGeeX 4

Open-source multilingual code generation model with strong performance

code-generationcode-completionmulti-language+1

33KOpen Weight Docs

Google·Jun 27, 2024

Gemma 2 27B

Open-weight model for research and development

code-generationanalysisreasoning

8KOpen Weight Docs

Google·Jun 27, 2024

Gemma 2 9B

Efficient open-weight model for various tasks

code-generationanalysischat

8KOpen Weight Docs

Alibaba·Jun 22, 2024

GTE-Qwen2-7B-instruct

High-performance embedding model based on Qwen2

embeddingslong-contextmultilingual

33KOpen Weight Docs

Suno·Jun 21, 2024

Suno v3.5

AI music generation model

music-generationaudio-creationvocals

N/A Docs

DeepSeek·Jun 17, 2024

DeepSeek Coder V2

Code-specialized MoE model supporting 300+ languages

code-generationcode-completionmath+1

128KOpen Weight Docs

NVIDIA·Jun 14, 2024

Nemotron-4 70B

NVIDIA's flagship model for enterprise

code-generationreasoninganalysis

33KOpen Weight Docs

NVIDIA·Jun 14, 2024

Nemotron-4 340B

Largest NVIDIA model for enterprise tasks

code-generationreasoninganalysis+1

4KOpen Weight Docs

Alibaba·Jun 7, 2024

Qwen 2 72B

Previous generation large Qwen model

code-generationreasoningmultilingual

131KOpen Weight Docs

Zhipu AI·Jun 5, 2024

GLM-4 9B

Efficient bilingual model from GLM family

code-generationreasoningbilingual+1

128KOpen Weight Docs

CMU·Jun 1, 2024

PolyCoder 16B

Open-source polyglot code model trained on many programming languages

code-generationmulti-language

16KOpen Weight Docs

Mistral AI·May 29, 2024

Codestral

Specialized code model trained on 80+ programming languages

code-generationcode-completionfill-in-the-middle

32K$0.2/1M in Docs

Microsoft·May 21, 2024

Phi-3-small

Balanced Phi-3 model for diverse tasks

code-generationreasoninganalysis+1

128KOpen Weight Docs

Microsoft·May 21, 2024

Phi-3-medium

Largest Phi-3 for complex reasoning

code-generationcomplex-reasoninganalysis

128KOpen Weight Docs

Google·May 14, 2024

Gemini 1.5 Pro

Production-ready model with massive context window for complex tasks

code-generationcode-translationlong-context+1

2.0M$1.25/1M in Docs

Google·May 14, 2024

Gemini 1.5 Flash

Fast and versatile model for diverse tasks at scale

code-generationcode-translationanalysis

1.0M$0.075/1M in Docs

OpenAI·May 13, 2024

GPT-4o

Multimodal flagship model with vision and audio capabilities, optimized for speed and cost

code-generationcode-translationanalysis+2

128K$2.5/1M in Docs

01.AI·May 13, 2024

Yi 1.5 34B Chat

Enhanced Yi chat model with extended context

chatcode-generationreasoning

16KOpen Weight Docs

01.AI·May 13, 2024

Yi Large

Flagship Yi model via API

code-generationreasoninganalysis

33K Docs

DeepSeek·May 6, 2024

DeepSeek V2

Efficient MoE model with strong general capabilities

code-generationreasoningchat+1

128KOpen Weight Docs

DeepSeek·May 6, 2024

DeepSeek Chat

Optimized chat model for conversations

chatcode-generationanalysis

33K$0.14/1M in Docs

IBM·May 6, 2024

Granite Code 34B

Code-specialized Granite model

code-generationcode-explanationcode-review

8KOpen Weight Docs

IBM·May 6, 2024

Granite Code 20B

IBM's enterprise-focused code model with strong security awareness

code-generationcode-reviewsecurity-analysis

8KOpen Weight Docs

IBM·May 6, 2024

Granite Code 8B

Efficient IBM code model for resource-constrained deployments

code-generationcode-completion

8KOpen Weight Docs

Amazon·Apr 30, 2024

Amazon Q Developer

Next-gen AWS coding assistant with broad AWS service integration

code-generationcode-transformationsecurity-scanning+1

33K Docs

Snowflake·Apr 24, 2024

Snowflake Arctic

Enterprise-focused MoE model

sql-generationcode-generationanalysis

4KOpen Weight Docs

Amazon·Apr 23, 2024

Amazon Titan Text Premier

Most capable Titan model for complex tasks

text-generationreasoningcode-generation

32K Docs

Microsoft·Apr 23, 2024

Phi-3-mini

Smallest Phi-3 model with strong capabilities

code-generationreasoningchat+1

128KOpen Weight Docs

Meta·Apr 18, 2024

Llama 3 8B

Efficient Llama 3 model for everyday tasks

code-generationchatanalysis

8KOpen Weight Docs

Meta·Apr 18, 2024

Llama 3 70B

Large Llama 3 model for complex tasks

code-generationreasoninganalysis

8KOpen Weight Docs

WizardLM·Apr 15, 2024

WizardLM 2 8x22B

Large MoE wizard model for complex tasks

code-generationreasoninganalysis

64KOpen Weight Docs

Alibaba·Apr 15, 2024

CodeQwen 1.5 7B

Efficient code model based on Qwen 1.5 architecture

code-generationcode-completion

66KOpen Weight Docs

Snowflake·Apr 11, 2024

Snowflake Arctic Embed L

Enterprise embedding model from Snowflake

embeddingssemantic-search

512Open Weight Docs

Mistral AI·Apr 10, 2024

Mixtral 8x22B

Large MoE model for complex tasks

code-generationreasoningmath+1

66KOpen Weight Docs

Google·Apr 9, 2024

CodeGemma 7B

Code-specialized open model based on Gemma for programming tasks

code-generationcode-completioncode-infilling

8KOpen Weight Docs

Cohere·Apr 4, 2024

Command R+

Most capable Cohere model for complex tasks

ragcode-generationreasoning+2

128KOpen Weight Docs

xAI·Mar 28, 2024

Grok-1.5

Enhanced Grok with improved reasoning

code-generationreasoningmath+1

128K Docs

Databricks·Mar 27, 2024

DBRX

MoE model optimized for enterprise

code-generationreasoninganalysis+1

33KOpen Weight Docs

xAI·Mar 17, 2024

Grok-1

Original open-weight Grok model

code-generationreasoningchat

8KOpen Weight Docs

Anthropic·Mar 14, 2024

Claude 3 Haiku

Fastest Claude 3 model for instant responses

code-generationanalysischat

200K$0.25/1M in Docs

Cohere·Mar 11, 2024

Command R

RAG-optimized model for enterprise search

ragcode-generationanalysis+1

128KOpen Weight Docs

Mixed Bread·Mar 7, 2024

mxbai-embed-large

High-quality embedding model

embeddingssemantic-searchclustering

512Open Weight Docs

Anthropic·Mar 4, 2024

Claude 3 Opus

Powerful model for complex tasks requiring deep expertise

code-generationcomplex-reasoninganalysis+1

200K$15/1M in Docs

Anthropic·Mar 4, 2024

Claude 3 Sonnet

Balanced Claude 3 model for enterprise tasks

code-generationanalysisreasoning

200K$3/1M in Docs

TabNine·Mar 1, 2024

TabNine Enterprise

Enterprise AI code completion with custom model training

code-completioncode-generationcustom-training

33K Docs

BigCode·Feb 28, 2024

StarCoder2 15B

Code-focused model trained on The Stack v2

code-generationcode-completioncode-explanation

16KOpen Weight Docs

BigCode·Feb 28, 2024

StarCoder2 7B

Efficient code model for development

code-generationcode-completion

16KOpen Weight Docs

BigCode·Feb 28, 2024

StarCoder2 3B

Compact code model for edge deployment

code-generationcode-completion

16KOpen Weight Docs

Mistral AI·Feb 26, 2024

Mistral Small

Cost-effective model for simple tasks

code-generationchatclassification

33K$1/1M in Docs

Google·Feb 21, 2024

Gemma 7B

Original Gemma model for lightweight tasks

code-generationchatanalysis

8KOpen Weight Docs

Google·Feb 8, 2024

Gemini Ultra

Most capable Gemini model for complex tasks

code-generationreasoningmultimodal+1

128K Docs

Alibaba·Feb 5, 2024

Qwen 1.5 72B

Older Qwen model for compatibility

code-generationchatanalysis

33KOpen Weight Docs

Nomic AI·Feb 1, 2024

Nomic Embed Text

Open-source text embedding model

embeddingslong-context-embeddings

8KOpen Weight Docs

Supermaven·Feb 1, 2024

Supermaven

Ultra-fast AI code completion with 1M token context

code-completioncode-generationlarge-context

1.0M Docs

Alibaba·Jan 30, 2024

Qwen Max

Most capable Qwen via API

code-generationreasoninganalysis+1

33K Docs

Alibaba·Jan 30, 2024

Qwen Plus

Balanced Qwen model via API

code-generationchatanalysis

33K Docs

Alibaba·Jan 30, 2024

Qwen Turbo

Fast Qwen model for quick tasks

chatcode-generationsummarization

8K Docs

BAAI·Jan 30, 2024

BGE-M3

Multi-lingual, multi-functionality embedding model

embeddingsmultilingualdense-sparse-retrieval

8KOpen Weight Docs

Meta·Jan 29, 2024

Code Llama 70B

Specialized code model fine-tuned from Llama 2 for programming tasks

code-generationcode-completioninfilling

100KOpen Weight Docs

Meta·Jan 29, 2024

Code Llama 70B Instruct

Instruction-tuned Code Llama for following complex coding instructions

code-generationcode-reviewdebugging+1

16KOpen Weight Docs

OpenAI·Jan 25, 2024

text-embedding-3-large

OpenAI's latest embedding model

embeddingssemantic-searchflexible-dimensions

8K Docs

OpenAI·Jan 25, 2024

text-embedding-3-small

Efficient OpenAI embedding model

embeddingssemantic-search

8K Docs

Shanghai AI Laboratory·Jan 17, 2024

InternLM 2 20B

Bilingual model with strong reasoning

code-generationreasoningmath+1

200KOpen Weight Docs

Sourcegraph·Jan 15, 2024

Sourcegraph Cody

AI coding assistant with deep codebase understanding

code-generationcode-searchcode-explanation+1

100K Docs

Stability AI·Jan 9, 2024

Stable Code 3B

Lightweight code model optimized for fast inference and local deployment

code-generationcode-completion

16KOpen Weight Docs

Mistral AI·Jan 8, 2024

Mistral Medium

Balanced model for diverse tasks

code-generationreasoninganalysis

33K$2.7/1M in Docs

Mistral AI·Jan 8, 2024

Mistral Embed

Embedding model for semantic search

embeddingssemantic-searchrag

8K Docs

Cursor·Jan 1, 2024

Cursor AI

AI-native code editor with advanced code understanding

code-generationcode-reviewcodebase-understanding+1

128K Docs

Microsoft·Dec 19, 2023

E5-Mistral-7B-Instruct

Instruction-following embedding model

embeddingsinstruction-followingsemantic-search

4KOpen Weight Docs

Upstage·Dec 13, 2023

SOLAR 10.7B

Depth-upscaled model with strong performance

code-generationreasoningchat

4KOpen Weight Docs

Microsoft·Dec 12, 2023

Phi-2

Small but capable model rivaling larger ones

code-generationreasoningmath+1

2KOpen Weight Docs

Mistral AI·Dec 11, 2023

Mixtral 8x7B

Mixture-of-experts model with efficient inference

code-generationreasoningmultilingual

33KOpen Weight Docs

Meta·Dec 8, 2023

SeamlessM4T v2

Multilingual speech and text translation

speech-to-texttext-to-speechtranslation

N/AOpen Weight Docs

Google·Dec 6, 2023

Gemini 1.0 Pro

Original Gemini Pro model for general tasks

code-generationanalysischat

32K$0.5/1M in Docs

ise-uiuc·Dec 4, 2023

Magicoder S-DS 6.7B

Efficient code model trained with OSS-Instruct methodology

code-generationcode-completion

16KOpen Weight Docs

OpenAI·Nov 6, 2023

GPT-4 Turbo

Enhanced GPT-4 with 128K context and improved performance

code-generationvisionreasoning+1

128K$10/1M in Docs

01.AI·Nov 6, 2023

Yi 34B

Large bilingual model from Yi series

code-generationreasoningbilingual

4KOpen Weight Docs

01.AI·Nov 6, 2023

Yi 6B

Efficient Yi model for lighter tasks

code-generationchatbilingual

4KOpen Weight Docs

OpenAI·Nov 6, 2023

Whisper Large v3

Speech recognition model for transcription

speech-to-texttranscriptionmultilingual

N/AOpen Weight Docs

Cohere·Nov 2, 2023

Cohere Embed v3

Enterprise-grade embedding model

embeddingsmultilingualcompression

512 Docs

OpenChat·Nov 1, 2023

OpenChat 3.5

Open chat model with RLHF training

chatcode-generationreasoning

8KOpen Weight Docs

DeepSeek·Nov 1, 2023

DeepSeek Coder 33B Instruct

Instruction-tuned DeepSeek coding model for following coding instructions

code-generationinstruction-followingdebugging

16KOpen Weight Docs

Refact AI·Oct 12, 2023

Refact 1.6B

Ultra-efficient code model for real-time code completion

code-completioncode-infilling

4KOpen Weight Docs

OpenAI·Oct 3, 2023

DALL-E 3

OpenAI's latest image generation model

image-generationtext-to-imageprompt-understanding

N/A Docs

Amazon·Sep 28, 2023

Amazon Titan Text Express

Fast and cost-effective model for general tasks

text-generationsummarizationchat

8K Docs

Amazon·Sep 28, 2023

Amazon Titan Text Lite

Lightweight model for cost-sensitive applications

text-generationsummarization

4K Docs

Mistral AI·Sep 27, 2023

Mistral 7B

Efficient base model with sliding window attention

code-generationchatanalysis

33KOpen Weight Docs

Microsoft·Sep 11, 2023

Phi-1.5

Enhanced Phi with improved reasoning

code-generationreasoningchat

2KOpen Weight Docs

Technology Innovation Institute·Sep 6, 2023

Falcon 180B

Largest open Falcon model

text-generationreasoninganalysis

2KOpen Weight Docs

Baichuan·Sep 6, 2023

Baichuan 2 13B

Chinese-focused large language model

text-generationcode-generationchinese

4KOpen Weight Docs

WizardLM·Aug 26, 2023

WizardCoder 34B

Instruction-following code model with strong complex task performance

code-generationcode-reviewdebugging

8KOpen Weight Docs

Phind·Aug 25, 2023

Phind CodeLlama 34B

Fine-tuned Code Llama optimized for code generation and explanation

code-generationcode-explanationdebugging

16KOpen Weight Docs

Meta·Aug 24, 2023

Code Llama 7B

Code-specialized Llama model for development

code-generationcode-completioncode-infilling

100KOpen Weight Docs

Meta·Aug 24, 2023

Code Llama 13B

Mid-size code-specialized Llama model

code-generationcode-completiondebugging

100KOpen Weight Docs

Meta·Aug 24, 2023

Code Llama 34B

Large code-specialized Llama model

code-generationcode-reasoningdebugging

100KOpen Weight Docs

Meta·Aug 24, 2023

Code Llama Instruct 34B

Instruction-tuned Code Llama for complex tasks

code-generationinstruction-followingdebugging

16KOpen Weight Docs

Meta·Aug 24, 2023

Code Llama Python 34B

Python-specialized Code Llama model

python-generationcode-completionpython-debugging

16KOpen Weight Docs

Meta·Aug 24, 2023

Code Llama 34B Instruct

Efficient instruction-tuned Code Llama for coding tasks

code-generationcode-reviewdebugging

16KOpen Weight Docs

Replit·Jul 26, 2023

Replit Code V1.5 3B

Efficient code model trained on Replit's diverse codebase

code-generationcode-completion

4KOpen Weight Docs

Meta·Jul 18, 2023

Llama 2 7B

Previous generation efficient Llama model

chatcode-generationanalysis

4KOpen Weight Docs

Meta·Jul 18, 2023

Llama 2 13B

Mid-size previous generation Llama model

chatcode-generationreasoning

4KOpen Weight Docs

Meta·Jul 18, 2023

Llama 2 70B

Largest previous generation Llama model

code-generationreasoninganalysis

4KOpen Weight Docs

MosaicML·Jun 22, 2023

MPT-30B

Commercial-friendly open model

text-generationcode-generationanalysis

8KOpen Weight Docs

Microsoft·Jun 20, 2023

Phi-1

First Phi model focused on coding

code-generationcode-completion

2KOpen Weight Docs

Aider·Jun 1, 2023

Aider

AI pair programming tool for terminal with git integration

code-generationcode-refactoringgit-integration

128KOpen Weight Docs

Google·Jun 1, 2023

Codey

Google's code-specialized model for enterprise development

code-generationcode-completioncode-explanation

33K Docs

Technology Innovation Institute·May 25, 2023

Falcon 40B

Mid-size Falcon model

text-generationcode-generationanalysis

2KOpen Weight Docs

Technology Innovation Institute·May 25, 2023

Falcon 7B

Efficient Falcon model

text-generationchat

2KOpen Weight Docs

Google·May 10, 2023

PaLM 2

Google's previous generation foundation model

code-generationreasoningmultilingual

32K Docs

Continue·May 1, 2023

Continue

Open-source AI code assistant supporting multiple models

code-generationcode-reviewchat+1

128KOpen Weight Docs

Amazon·Apr 13, 2023

Amazon CodeWhisperer

AWS-native AI coding assistant with security scanning

code-generationcode-completionsecurity-scanning

8K Docs

Suno·Apr 10, 2023

Bark

Open-source text-to-audio model

text-to-speechmusicsound-effects

N/AOpen Weight Docs

OpenAI·Mar 14, 2023

GPT-4

Original GPT-4 model with strong reasoning and coding capabilities

code-generationreasoninganalysis+1

8K$30/1M in Docs

Cohere·Mar 1, 2023

Command Light

Lightweight model for simple tasks

text-generationsummarizationclassification

4K Docs

Cohere·Mar 1, 2023

Command

General-purpose instruction-following model

text-generationsummarizationclassification+1

4K Docs

BigCode·Jan 1, 2023

SantaCoder

Efficient code model trained on Python, Java, and JavaScript

code-generationcode-completion

2KOpen Weight Docs

OpenAI·Nov 30, 2022

GPT-3.5 Turbo

Fast and cost-effective model for everyday tasks

code-generationchatanalysis

16K$0.5/1M in Docs

Codeium·Nov 1, 2022

Codeium

Free AI code completion with broad IDE support

code-completioncode-generationchat

33K Docs

BigScience·Jul 6, 2022

BLOOM

Multilingual open model supporting 46 languages

text-generationmultilingualcode-generation

2KOpen Weight Docs

GitHub·Jun 21, 2022

GitHub Copilot

AI pair programmer powered by OpenAI with deep GitHub integration

code-generationcode-completioncode-review+1

8K$0/1M in Docs

Meta·Apr 1, 2022

InCoder 6B

Infilling-capable code model for completion and generation

code-generationcode-infilling

2KOpen Weight Docs

OpenAI·Aug 10, 2021

OpenAI Codex

OpenAI's code model powering GitHub Copilot

code-generationcode-completioncode-translation

8K Docs