功能特性¶
相容性矩陣¶
下表顯示了互斥的功能以及在某些硬體上的支援情況。
使用的符號具有以下含義
- ✅ = 完全相容
- 🟠 = 部分相容
- ❌ = 不相容
- ❔ = 未知或待定
注意
檢視帶有連結的 ❌ 或 🟠 以檢視不支援的功能/硬體組合的跟蹤問題。
特性 x 特性¶
| 功能 | CP | APC | LoRA | SD | CUDA graph | pooling | enc-dec | logP | prmpt logP | async output | multi-step | mm | best-of | beam-search | prompt-embeds |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| CP | ✅ | ||||||||||||||
| APC | ✅ | ✅ | |||||||||||||
| LoRA | ✅ | ✅ | ✅ | ||||||||||||
| SD | ✅ | ✅ | ❌ | ✅ | |||||||||||
| CUDA graph | ✅ | ✅ | ✅ | ✅ | ✅ | ||||||||||
| pooling | 🟠* | 🟠* | ✅ | ❌ | ✅ | ✅ | |||||||||
| enc-dec | ❌ | ❌ | ❌ | ❌ | ✅ | ✅ | ✅ | ||||||||
| logP | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | |||||||
| prmpt logP | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ | ||||||
| async output | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ | ❌ | ✅ | ✅ | ✅ | |||||
| multi-step | ❌ | ✅ | ❌ | ❌ | ✅ | ❌ | ❌ | ✅ | ✅ | ✅ | ✅ | ||||
| mm | ✅ | ✅ | 🟠^ | ❔ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ❔ | ✅ | |||
| best-of | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ | ✅ | ✅ | ✅ | ❔ | ❌ | ✅ | ✅ | ||
| beam-search | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ | ✅ | ✅ | ✅ | ❔ | ❌ | ❔ | ✅ | ✅ | |
| prompt-embeds | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ | ❌ | ✅ | ❌ | ❔ | ❔ | ❌ | ❔ | ❔ | ✅ |
* 分塊預填充和字首快取僅適用於因果注意力機制的最後一個 token 或全部 pooling。
^ LoRA 僅適用於多模態模型的語言主幹。
特性 x 硬體¶
| 功能 | Volta | Turing | Ampere | Ada | Hopper | CPU | AMD | Intel GPU |
|---|---|---|---|---|---|---|---|---|
| CP | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| APC | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| LoRA | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| SD | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | 🟠 |
| CUDA graph | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ |
| pooling | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| enc-dec | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ |
| mm | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| prompt-embeds | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ❔ | ✅ |
| logP | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| prmpt logP | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| async output | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ✅ |
| multi-step | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ |
| best-of | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| beam-search | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
注意
有關 Google TPU 上功能支援的資訊,請參閱 TPU-Inference 推薦模型和功能 文件。