预装模型矩阵
全部选自 BP §3.4;链接指向各项目官方主页,便于法务复核 License。
| 模型 | 角色 | 参数(B) | License | 显存需求 | 性能锚定 | |
|---|---|---|---|---|---|---|
| Hermes 4 70B Q4_K_M | agent-llm | 70 | MIT | 22 GB | RTX 4090 95 tok/s · MMLU 0.835 | 主页 |
| Hermes 3 Llama 8B | lightweight-llm | 8 | MIT | 6 GB | 4060 Ti 70 tok/s · MMLU 0.71 | 主页 |
| Gemma 3 27B | lightweight-llm | 27 | Apache 2.0 | 18 GB | RTX 4090 110 tok/s · 中文 SuperCLUE 良好 | 主页 |
| Wan 2.5 | video | 5 | Apache 2.0 | 22 GB | RTX 4090 5s/1080p ≈ 200s | 主页 |
| HunyuanVideo 1.5 | video | 13 | 商用许可 | 24 GB | RTX 4090 5s/720p ≈ 90s | 主页 |
| LTX-Video 2.3 | video | 2 | 商用许可(限制条款) | 12 GB | RTX 4090 5s/720p ≈ 35s(极速档) | 主页 |
| FLUX.1 Schnell | image | 12 | Apache 2.0 | 16 GB | RTX 4090 1024² · 4 步 ≈ 1.2s | 主页 |
| Whisper Large v3 | asr | 1.5 | MIT | 4 GB | RTX 4090 实时 5× | 主页 |
| Kokoro 82M | tts | 0.082 | Apache 2.0 | 1 GB | 24kHz · 1× 实时(任意 GPU) | 主页 |
| BGE-M3 Embed | embed | 0.56 | MIT | 2 GB | 1024 dim · 中英双语顶级 | 主页 |