原生 Gemini 格式

原生 Gemini 格式

curl --request POST \
  --url https://api.gravitex.ai/v1beta/models/{model}:generateContent \
  --header 'Content-Type: application/json' \
  --data '
{
  "contents": [
    {}
  ],
  "generationConfig": {},
  "systemInstruction": {},
  "safetySettings": [
    {}
  ],
  "tools": [
    {}
  ],
  "toolConfig": {},
  "cachedContent": "<string>"
}
'

import requests

url = "https://api.gravitex.ai/v1beta/models/{model}:generateContent"

payload = {
    "contents": [{}],
    "generationConfig": {},
    "systemInstruction": {},
    "safetySettings": [{}],
    "tools": [{}],
    "toolConfig": {},
    "cachedContent": "<string>"
}
headers = {"Content-Type": "application/json"}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': 'application/json'},
  body: JSON.stringify({
    contents: [{}],
    generationConfig: {},
    systemInstruction: {},
    safetySettings: [{}],
    tools: [{}],
    toolConfig: {},
    cachedContent: '<string>'
  })
};

fetch('https://api.gravitex.ai/v1beta/models/{model}:generateContent', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.gravitex.ai/v1beta/models/{model}:generateContent",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'contents' => [
        [
                
        ]
    ],
    'generationConfig' => [
        
    ],
    'systemInstruction' => [
        
    ],
    'safetySettings' => [
        [
                
        ]
    ],
    'tools' => [
        [
                
        ]
    ],
    'toolConfig' => [
        
    ],
    'cachedContent' => '<string>'
  ]),
  CURLOPT_HTTPHEADER => [
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.gravitex.ai/v1beta/models/{model}:generateContent"

	payload := strings.NewReader("{\n  \"contents\": [\n    {}\n  ],\n  \"generationConfig\": {},\n  \"systemInstruction\": {},\n  \"safetySettings\": [\n    {}\n  ],\n  \"tools\": [\n    {}\n  ],\n  \"toolConfig\": {},\n  \"cachedContent\": \"<string>\"\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "application/json")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.gravitex.ai/v1beta/models/{model}:generateContent")
  .header("Content-Type", "application/json")
  .body("{\n  \"contents\": [\n    {}\n  ],\n  \"generationConfig\": {},\n  \"systemInstruction\": {},\n  \"safetySettings\": [\n    {}\n  ],\n  \"tools\": [\n    {}\n  ],\n  \"toolConfig\": {},\n  \"cachedContent\": \"<string>\"\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.gravitex.ai/v1beta/models/{model}:generateContent")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = 'application/json'
request.body = "{\n  \"contents\": [\n    {}\n  ],\n  \"generationConfig\": {},\n  \"systemInstruction\": {},\n  \"safetySettings\": [\n    {}\n  ],\n  \"tools\": [\n    {}\n  ],\n  \"toolConfig\": {},\n  \"cachedContent\": \"<string>\"\n}"

response = http.request(request)
puts response.read_body

{
  "candidates": [
    {
      "content": {
        "parts": [{"text": "回复文本"}],
        "role": "model"
      },
      "finishReason": "STOP",
      "index": 0,
      "safetyRatings": []
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 10,
    "candidatesTokenCount": 20,
    "totalTokenCount": 30,
    "thoughtsTokenCount": 0,
    "cachedContentTokenCount": 0
  },
  "modelVersion": "gemini-2.5-pro",
  "createTime": "2025-01-01T00:00:00Z"
}

POST

v1beta

models

{model}

:generateContent

原生 Gemini 格式

curl --request POST \
  --url https://api.gravitex.ai/v1beta/models/{model}:generateContent \
  --header 'Content-Type: application/json' \
  --data '
{
  "contents": [
    {}
  ],
  "generationConfig": {},
  "systemInstruction": {},
  "safetySettings": [
    {}
  ],
  "tools": [
    {}
  ],
  "toolConfig": {},
  "cachedContent": "<string>"
}
'

import requests

url = "https://api.gravitex.ai/v1beta/models/{model}:generateContent"

payload = {
    "contents": [{}],
    "generationConfig": {},
    "systemInstruction": {},
    "safetySettings": [{}],
    "tools": [{}],
    "toolConfig": {},
    "cachedContent": "<string>"
}
headers = {"Content-Type": "application/json"}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': 'application/json'},
  body: JSON.stringify({
    contents: [{}],
    generationConfig: {},
    systemInstruction: {},
    safetySettings: [{}],
    tools: [{}],
    toolConfig: {},
    cachedContent: '<string>'
  })
};

fetch('https://api.gravitex.ai/v1beta/models/{model}:generateContent', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.gravitex.ai/v1beta/models/{model}:generateContent",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'contents' => [
        [
                
        ]
    ],
    'generationConfig' => [
        
    ],
    'systemInstruction' => [
        
    ],
    'safetySettings' => [
        [
                
        ]
    ],
    'tools' => [
        [
                
        ]
    ],
    'toolConfig' => [
        
    ],
    'cachedContent' => '<string>'
  ]),
  CURLOPT_HTTPHEADER => [
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.gravitex.ai/v1beta/models/{model}:generateContent"

	payload := strings.NewReader("{\n  \"contents\": [\n    {}\n  ],\n  \"generationConfig\": {},\n  \"systemInstruction\": {},\n  \"safetySettings\": [\n    {}\n  ],\n  \"tools\": [\n    {}\n  ],\n  \"toolConfig\": {},\n  \"cachedContent\": \"<string>\"\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "application/json")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.gravitex.ai/v1beta/models/{model}:generateContent")
  .header("Content-Type", "application/json")
  .body("{\n  \"contents\": [\n    {}\n  ],\n  \"generationConfig\": {},\n  \"systemInstruction\": {},\n  \"safetySettings\": [\n    {}\n  ],\n  \"tools\": [\n    {}\n  ],\n  \"toolConfig\": {},\n  \"cachedContent\": \"<string>\"\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.gravitex.ai/v1beta/models/{model}:generateContent")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = 'application/json'
request.body = "{\n  \"contents\": [\n    {}\n  ],\n  \"generationConfig\": {},\n  \"systemInstruction\": {},\n  \"safetySettings\": [\n    {}\n  ],\n  \"tools\": [\n    {}\n  ],\n  \"toolConfig\": {},\n  \"cachedContent\": \"<string>\"\n}"

response = http.request(request)
puts response.read_body

{
  "candidates": [
    {
      "content": {
        "parts": [{"text": "回复文本"}],
        "role": "model"
      },
      "finishReason": "STOP",
      "index": 0,
      "safetyRatings": []
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 10,
    "candidatesTokenCount": 20,
    "totalTokenCount": 30,
    "thoughtsTokenCount": 0,
    "cachedContentTokenCount": 0
  },
  "modelVersion": "gemini-2.5-pro",
  "createTime": "2025-01-01T00:00:00Z"
}

简介

Gemini 原生 API 采用 Google Gemini 的请求与响应格式，适用于 Google 官方客户端（如 google-generativeai SDK）或需要直接使用 Gemini 数据结构的场景。该接口遵循 Gemini API 规范，支持思考模式（Thinking）、多模态输入、工具调用、Google 搜索（Grounding）、Context Caching、图像生成等完整能力。

若使用 OpenAI 兼容客户端（如 OpenAI SDK）调用 Gemini，请使用 Gemini OpenAI 格式（对话）。其它模型见原生 OpenAI 格式（ChatCompletions）。

与 OpenAI 格式的区别

特性	Gemini 原生	OpenAI 兼容（/v1/chat/completions）
消息结构	`contents[].parts[]`（text / inlineData / fileData）	`messages[].content`
角色	`user` / `model`	`user` / `assistant` / `system`
系统提示	`systemInstruction.parts`	`messages` 中 role=system
流式	`streamGenerateContent?alt=sse`	`stream: true`
思考模式	`generationConfig.thinkingConfig` 或模型后缀	模型后缀（如 `-thinking`）

API 端点

功能	方法	路径
文本生成（非流式）	POST	`/v1beta/models/{model}:generateContent`
文本生成（流式）	POST	`/v1beta/models/{model}:streamGenerateContent?alt=sse`
单条 Embedding	POST	`/v1beta/models/{model}:embedContent`
批量 Embedding	POST	`/v1beta/models/{model}:batchEmbedContents`

路径中的 {model} 需替换为实际模型 ID，如 gemini-2.5-pro、gemini-3-pro-preview。

认证

支持以下任一方式：

string

Bearer Token：Bearer sk-xxxxxxxxxx（推荐，与 GravitexAI 其他接口一致）

string

Google 风格 API Key：x-goog-api-key: sk-xxxxxxxxxx

也可在 URL 中传参：?key=sk-xxxxxxxxxx。

请求参数

generateContent / streamGenerateContent

array

必填

对话内容列表。每项包含 role（user 或 model）和 parts 数组。parts 元素可为：{"text": "..."}、{"inlineData": {"mimeType": "...", "data": "base64..."}}、{"fileData": {"mimeType": "...", "fileUri": "gs://..."}}。

object

生成配置。

temperature：0–2，随机性
topP：核采样
topK：Top-K 采样
maxOutputTokens：最大输出 token 数
stopSequences：停止序列
responseMimeType：如 text/plain
responseModalities：如 ["TEXT"] 或 ["IMAGE"]
thinkingConfig：思考模式（见下文）
imageConfig：图像生成配置（见下文）

object

系统指令，格式为 {"parts": [{"text": "..."}]}。

array

安全等级，如 [{"category": "HARM_CATEGORY_HARASSMENT", "threshold": "OFF"}]。

array

工具声明（Function Calling），见高级功能。

object

工具配置，如 functionCallingConfig.mode：AUTO / ANY / NONE。

string

Context Caching 返回的缓存 ID，用于复用已缓存上下文。

响应格式

非流式 generateContent 返回 JSON：

{
  "candidates": [
    {
      "content": {
        "parts": [{"text": "回复文本"}],
        "role": "model"
      },
      "finishReason": "STOP",
      "index": 0,
      "safetyRatings": []
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 10,
    "candidatesTokenCount": 20,
    "totalTokenCount": 30,
    "thoughtsTokenCount": 0,
    "cachedContentTokenCount": 0
  },
  "modelVersion": "gemini-2.5-pro",
  "createTime": "2025-01-01T00:00:00Z"
}

流式接口返回 SSE，每行以 data: 开头，内容为 JSON 片段（含 candidates[].content.parts 等）。

基础示例

cURL（非流式）
cURL（流式）
Python（google-generativeai）
Node.js

curl -X POST "https://api.gravitex.ai/v1beta/models/gemini-2.5-pro:generateContent" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxx" \
  -d '{
    "contents": [
      {"role": "user", "parts": [{"text": "用一句话介绍人工智能"}]}
    ],
    "generationConfig": {
      "temperature": 0.7,
      "maxOutputTokens": 1024
    }
  }'

curl -N -X POST "https://api.gravitex.ai/v1beta/models/gemini-2.5-pro:streamGenerateContent?alt=sse" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxx" \
  -d '{
    "contents": [
      {"role": "user", "parts": [{"text": "用一句话介绍人工智能"}]}
    ],
    "generationConfig": {"maxOutputTokens": 1024}
  }'

import google.generativeai as genai

genai.configure(
    api_key="sk-xxxxxxxxxx",
    transport="rest",
    client_options={"api_endpoint": "https://api.gravitex.ai"}
)

model = genai.GenerativeModel("gemini-2.5-pro")
response = model.generate_content("用一句话介绍人工智能")
print(response.text)

const { GoogleGenerativeAI } = require("@google/generative-ai");

const genAI = new GoogleGenerativeAI("sk-xxxxxxxxxx");
genAI.apiKey = "sk-xxxxxxxxxx";
// 若 SDK 支持自定义 baseUrl，设置为 https://api.gravitex.ai
const model = genAI.getGenerativeModel({ model: "gemini-2.5-pro" });

const result = await model.generateContent("用一句话介绍人工智能");
const text = result.response.text();
console.log(text);

google-generativeai 默认请求 Google 官方端点，接入 GravitexAI 时需通过 client_options 或环境变量将 api_endpoint 设为 https://api.gravitex.ai。具体以所用 SDK 文档为准。

高级功能

思考模式（Thinking）

支持三种方式：

generationConfig.thinkingConfig（Gemini 2.5 Pro）：使用 thinkingBudget（token 数）
thinkingConfig.thinkingLevel（Gemini 3 Pro）：使用 LOW / HIGH
模型后缀：-thinking、-thinking-8192、-nothinking、-thinking-low、-thinking-high

thinkingBudget（2.5 Pro）
thinkingLevel（3 Pro）

{
  "contents": [{"role": "user", "parts": [{"text": "给一道几何题并分步解析"}]}],
  "generationConfig": {
    "maxOutputTokens": 8192,
    "thinkingConfig": {
      "includeThoughts": true,
      "thinkingBudget": 8192
    }
  }
}

{
  "contents": [{"role": "user", "parts": [{"text": "给一道几何题并分步解析"}]}],
  "generationConfig": {
    "maxOutputTokens": 8192,
    "thinkingConfig": {
      "includeThoughts": true,
      "thinkingLevel": "HIGH"
    }
  }
}

多模态输入

在 contents[].parts 中混合文本与媒体：

{
  "contents": [
    {
      "role": "user",
      "parts": [
        {"text": "描述这张图片"},
        {
          "inlineData": {
            "mimeType": "image/jpeg",
            "data": "/9j/4AAQSkZJRg..."
          }
        }
      ]
    }
  ]
}

图片：inlineData + base64 data，或 fileData + fileUri（如 gs://...）
音频：inlineData，mimeType 如 audio/mp3

工具调用（Function Calling）

{
  "contents": [{"role": "user", "parts": [{"text": "上海今天天气怎么样？"}]}],
  "tools": [
    {
      "functionDeclarations": [
        {
          "name": "get_weather",
          "description": "获取指定城市的天气",
          "parameters": {
            "type": "object",
            "properties": {
              "location": {"type": "string"}
            },
            "required": ["location"]
          }
        }
      ]
    }
  ],
  "toolConfig": {
    "functionCallingConfig": {
      "mode": "AUTO",
      "allowedFunctionNames": []
    }
  }
}

模型可能返回 functionCall part，需在下一轮 contents 中附带 functionResponse 再请求。

Google 搜索（Grounding）

启用后，模型可基于实时网络检索增强回答（如天气、新闻等）。在 tools 中加入 googleSearch 即可：

{
  "contents": [{"role": "user", "parts": [{"text": "今天北京天气怎么样？"}]}],
  "tools": [
    {
      "googleSearch": {}
    }
  ],
  "toolConfig": {
    "functionCallingConfig": {
      "mode": "AUTO"
    }
  }
}

若同时使用 Function Calling 与 Google 搜索，将 googleSearch: {} 与 functionDeclarations 放在同一 tools 数组的不同元素中即可。回答中可能包含检索来源信息（如 groundingMetadata）。

流式输出

使用端点：POST /v1beta/models/{model}:streamGenerateContent?alt=sse，请求体与 generateContent 相同。响应为 SSE 流，每条 data: 为一块 JSON。

Context Caching（上下文缓存）

首次请求不带 cachedContent，若服务端返回可缓存标识，后续请求在 body 中带上：

{
  "cachedContent": "cached-content-id",
  "contents": [{"role": "user", "parts": [{"text": "基于上文继续回答"}]}]
}

可降低长上下文重复计费与延迟。

图像生成（Gemini 2.5 Flash 等）

当模型支持图像输出时，在 generationConfig 中指定：

{
  "contents": [{"role": "user", "parts": [{"text": "画一只猫"}]}],
  "generationConfig": {
    "responseModalities": ["IMAGE"],
    "imageConfig": {
      "aspectRatio": "1:1",
      "imageSize": "1K",
      "imageOutputOptions": {"mimeType": "image/png"}
    }
  }
}

响应中 candidates[].content.parts 会包含 inlineData（如 base64 图片）。

Embedding API

单条：embedContent

端点：POST https://api.gravitex.ai/v1beta/models/{model}:embedContent 请求体示例：

{
  "model": "text-embedding-004",
  "content": {
    "parts": [{"text": "要嵌入的文本"}]
  }
}

或使用 model 在 path 中：/v1beta/models/text-embedding-004:embedContent，body 仅含 content。

批量：batchEmbedContents

端点：POST https://api.gravitex.ai/v1beta/models/{model}:batchEmbedContents 请求体示例：

{
  "requests": [
    {"content": {"parts": [{"text": "第一段文本"}]}},
    {"content": {"parts": [{"text": "第二段文本"}]}}
  ]
}

响应为数组，每项对应一条嵌入向量。

错误处理

接口使用 HTTP 状态码与 JSON body 表示错误，例如：

{
  "error": {
    "code": 400,
    "message": "Invalid request: ...",
    "status": "INVALID_ARGUMENT"
  }
}

常见情况：

状态码	含义
400	请求参数错误（如缺少 `contents`、模型不支持某参数）
401	认证失败（API Key 无效或未传）
404	模型不存在或路径错误
429	限流，请稍后重试
500	服务端错误

建议在客户端统一解析 error.message 并做重试或提示。

与 OpenAI 格式对比

项目	Gemini 原生	OpenAI（/v1/chat/completions）
基础 URL 路径	`/v1beta/models/{model}:generateContent`	`/v1/chat/completions`
认证	`Authorization: Bearer sk-xxx` 或 `x-goog-api-key`	`Authorization: Bearer sk-xxx`
消息格式	`contents[].parts[]`（text/inlineData/fileData）	`messages[].content`（字符串或数组）
系统提示	`systemInstruction.parts`	`messages` 中 `role: "system"`
流式	`streamGenerateContent?alt=sse`	`stream: true`
思考模式	`thinkingConfig` 或模型后缀	模型后缀（如 `-thinking`）
工具定义	`tools[].functionDeclarations`	`tools[].function`（OpenAI 格式）
适用客户端	Google SDK、自建 HTTP 客户端	OpenAI SDK、兼容 OpenAI 的各类客户端

选择建议：已使用 Google Gemini 生态或需要 Gemini 独有字段（如 thinkingConfig、原生多模态 part）时用原生接口；希望与 OpenAI 生态统一时用 /v1/chat/completions。

原生 Claude 格式原生 OpenAI 格式（Responses）

API 文档

对话与文本

安全与音频

图像系列

视频系列

文本补全和向量嵌入

接口模块

简介

与 OpenAI 格式的区别

API 端点

认证

请求参数

generateContent / streamGenerateContent

响应格式

基础示例

高级功能

思考模式（Thinking）

多模态输入

工具调用（Function Calling）

Google 搜索（Grounding）

流式输出

Context Caching（上下文缓存）

图像生成（Gemini 2.5 Flash 等）

Embedding API

单条：embedContent

批量：batchEmbedContents

错误处理

与 OpenAI 格式对比

​简介

​与 OpenAI 格式的区别

​API 端点

​认证

​请求参数

​generateContent / streamGenerateContent

​响应格式

​基础示例

​高级功能

​思考模式（Thinking）

​多模态输入

​工具调用（Function Calling）

​Google 搜索（Grounding）

​流式输出

​Context Caching（上下文缓存）

​图像生成（Gemini 2.5 Flash 等）

​Embedding API

​单条：embedContent

​批量：batchEmbedContents

​错误处理

​与 OpenAI 格式对比

简介

与 OpenAI 格式的区别

API 端点

认证

请求参数

generateContent / streamGenerateContent

响应格式

基础示例

高级功能

思考模式（Thinking）

多模态输入

工具调用（Function Calling）

Google 搜索（Grounding）

流式输出

Context Caching（上下文缓存）

图像生成（Gemini 2.5 Flash 等）

Embedding API

单条：embedContent

批量：batchEmbedContents

错误处理

与 OpenAI 格式对比