Documentation Index
Fetch the complete documentation index at: https://docs.gravitex.ai/llms.txt
Use this file to discover all available pages before exploring further.
简介
GravitexAI 音频能力分为两类:- OpenAI 格式:
/v1/audio/speech(TTS)、/v1/audio/transcriptions(STT)、/v1/audio/translations(翻译),兼容 OpenAI Audio API。 - Gemini 原生格式:
POST /v1beta/models/{model}:generateContent,通过responseModalities: ["AUDIO"]与speechConfig生成语音(如gemini-2.5-flash-preview-tts)。
https://api.gravitex.ai。Gemini 鉴权与 原生 Gemini 格式 一致。
认证
Bearer Token,如
Bearer sk-xxxxxxxxxx(OpenAI 与 Gemini 均支持)Gemini 可选:
x-goog-api-key: sk-xxxxxxxxxx请求示例
- OpenAI 格式
- Gemini 格式
- 文本转语音
- 音频转录
- 音频翻译
POST
/v1/audio/speech常用参数
OpenAI 格式
Speech(/v1/audio/speech)
- model:如
tts-1、tts-1-hd - input:待合成文本(≤ 4096 字符)
- voice:
alloy、echo、fable、onyx、nova、shimmer - response_format:
mp3、opus、aac、flac、wav、pcm
- file:音频文件(multipart)
- model:如
whisper-1
Gemini 格式(TTS)
- model(路径参数):如
gemini-2.5-flash-preview-tts、gemini-2.5-pro-preview-tts - contents[].parts[].text:待朗读或带风格指令的文本
- generationConfig.responseModalities:须包含
"AUDIO" - generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfig.voiceName:预置音色,如
Kore、Puck、Charon、Fenrir等
Gemini 音频仅通过
generateContent 输出,与 OpenAI /v1/audio/* 路径不同。完整 Gemini 参数(流式、多模态输入等)见 原生 Gemini 格式。