Deepgram


Prefix	`deepgram`
Default model	`aura-2`
Env var	`DEEPGRAM_API_KEY`
Official docs	developers.deepgram.com/docs/text-to-speech

Models

Model	Streaming	Audio Tags	Voice Cloning	Notes
`aura-2`	Yes	No	No	Current default
`aura`	Yes	No	No	Previous generation

Usage

import { generateSpeech } from "@speech-sdk/core"

const result = await generateSpeech({
  model: "deepgram/aura-2",
  text: "Hello from SpeechSDK!",
  voice: "thalia-en",
})

Deepgram's API expects the voice to be concatenated with the model (e.g. aura-2-thalia-en). SpeechSDK builds this identifier for you from the voice parameter — just pass the voice suffix like thalia-en, apollo-en, or orion-en.

Provider Options

await generateSpeech({
  model: "deepgram/aura-2",
  text: "Hello!",
  voice: "thalia-en",
  providerOptions: {
    encoding: "mp3",
    sample_rate: 24_000,
    container: "none",
  },
})

Custom Configuration

import { generateSpeech } from "@speech-sdk/core"
import { createDeepgram } from "@speech-sdk/core/providers"

const deepgram = createDeepgram({
  apiKey: process.env.DEEPGRAM_API_KEY,
})

const result = await generateSpeech({
  model: deepgram("aura-2"),
  text: "Hello!",
  voice: "thalia-en",
})

Deepgram

Models

Usage

Voice + Model

Provider Options

Custom Configuration

On this page