Base URL
https://<your-box-host>/v1
Chat Completions
与 OpenAI SDK 兼容;model 参数映射到本地 vLLM 模型名。
配额
- Free:仅局域网。
- Pro:1,000 次/月(出网)。
- Studio:10,000 次/月 + IP 白名单。
示例(Python)
from openai import OpenAI
client = OpenAI(base_url="https://<your-box-host>/v1", api_key="local-xxxx")
print(client.chat.completions.create(model="hermes-4-70b", messages=[{"role":"user","content":"你好"}]))