跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.gravitex.ai/llms.txt

Use this file to discover all available pages before exploring further.

简介

GravitexAI 音频能力分为两类:
  • OpenAI 格式/v1/audio/speech(TTS)、/v1/audio/transcriptions(STT)、/v1/audio/translations(翻译),兼容 OpenAI Audio API。
  • Gemini 原生格式POST /v1beta/models/{model}:generateContent,通过 responseModalities: ["AUDIO"]speechConfig 生成语音(如 gemini-2.5-flash-preview-tts)。
Base URL:https://api.gravitex.ai。Gemini 鉴权与 原生 Gemini 格式 一致。

认证

Authorization
string
必填
Bearer Token,如 Bearer sk-xxxxxxxxxx(OpenAI 与 Gemini 均支持)
x-goog-api-key
string
Gemini 可选:x-goog-api-key: sk-xxxxxxxxxx

请求示例

POST /v1/audio/speech
curl -X POST "https://api.gravitex.ai/v1/audio/speech" \
  -H "Authorization: Bearer sk-xxxxxxxxxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "你好,欢迎使用 GravitexAI。",
    "voice": "alloy",
    "response_format": "mp3",
    "speed": 1.0
  }' \
  --output speech.mp3

常用参数

OpenAI 格式

Speech(/v1/audio/speech
  • model:如 tts-1tts-1-hd
  • input:待合成文本(≤ 4096 字符)
  • voicealloyechofableonyxnovashimmer
  • response_formatmp3opusaacflacwavpcm
Transcriptions / Translations
  • file:音频文件(multipart)
  • model:如 whisper-1

Gemini 格式(TTS)

  • model(路径参数):如 gemini-2.5-flash-preview-ttsgemini-2.5-pro-preview-tts
  • contents[].parts[].text:待朗读或带风格指令的文本
  • generationConfig.responseModalities:须包含 "AUDIO"
  • generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfig.voiceName:预置音色,如 KorePuckCharonFenrir
Gemini 音频通过 generateContent 输出,与 OpenAI /v1/audio/* 路径不同。完整 Gemini 参数(流式、多模态输入等)见 原生 Gemini 格式
OpenAI 音频详见 OpenAI Audio API;Gemini TTS 详见 Speech generation