curl --request POST \
--url https://api.powertokens.ai/v1/chat/completions \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data '
{
"model": "glm-5-turbo",
"messages": [
{
"role": "system",
"content": "你是一个简洁专业的助手。"
},
{
"role": "user",
"content": "请用三句话介绍一下向量数据库。"
}
],
"temperature": 0.7,
"max_tokens": 1024
}
'{
"id": "chatcmpl_zhipu_123",
"object": "chat.completion",
"created": 1775174400,
"model": "glm-5",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "向量数据库是一种专门存储和检索向量表示的数据系统,常用于语义搜索、推荐和 RAG。",
"reasoning_content": "先给出定义,再补充典型场景。"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 42,
"completion_tokens": 31,
"total_tokens": 73,
"prompt_tokens_details": {
"cached_tokens": 0
}
}
}面向智谱 GLM 系列聊天模型的统一入口。
支持模型包括 glm-5-turbo、glm-5、glm-4.7、glm-4.7-flash、glm-4.5-air。同一路径支持纯文本对话,以及包含 image_url 分片的图像理解请求。
本文档公开字段:model、messages、stream、thinking、temperature、top_p、max_tokens、stop、tools、tool_choice。
curl --request POST \
--url https://api.powertokens.ai/v1/chat/completions \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data '
{
"model": "glm-5-turbo",
"messages": [
{
"role": "system",
"content": "你是一个简洁专业的助手。"
},
{
"role": "user",
"content": "请用三句话介绍一下向量数据库。"
}
],
"temperature": 0.7,
"max_tokens": 1024
}
'{
"id": "chatcmpl_zhipu_123",
"object": "chat.completion",
"created": 1775174400,
"model": "glm-5",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "向量数据库是一种专门存储和检索向量表示的数据系统,常用于语义搜索、推荐和 RAG。",
"reasoning_content": "先给出定义,再补充典型场景。"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 42,
"completion_tokens": 31,
"total_tokens": 73,
"prompt_tokens_details": {
"cached_tokens": 0
}
}
}在请求头中传入 Authorization: Bearer <token>。
智谱 chat completions 请求体。
模型名称。支持的模型包括 glm-5-turbo、glm-5、glm-4.7、glm-4.7-flash、glm-4.5-air。
glm-5-turbo, glm-5, glm-4.7, glm-4.7-flash, glm-4.5-air "glm-5-turbo"
消息列表。支持纯文本消息,以及包含 image_url 分片的图像输入。请求中至少需要包含一条非 system、非 assistant 的消息;不能只传 system 消息或只传 assistant 消息。
1Show child attributes
是否启用流式输出。为 true 时返回 text/event-stream。
思考模式配置。适用于支持 thinking 参数的模型。
Show child attributes
采样温度,取值范围为 [0, 1]。
0 <= x <= 1核采样概率阈值,取值范围为 [0.01, 1]。
0.01 <= x <= 1最大输出 token 数。
x >= 1停止词列表。当前仅支持单个停止词。
1工具定义列表。当前仅支持 function 工具形态。
128Show child attributes
工具选择策略。智谱该接口当前仅公开 auto。
auto