跳到內容

功能特性

相容性矩陣

下表顯示了互斥的功能以及在某些硬體上的支援情況。

使用的符號具有以下含義

  • ✅ = 完全相容
  • 🟠 = 部分相容
  • ❌ = 不相容
  • ❔ = 未知或待定

注意

檢視帶有連結的 ❌ 或 🟠 以檢視不支援的功能/硬體組合的跟蹤問題。

特性 x 特性

功能 CP APC LoRA SD CUDA graph pooling enc-dec logP prmpt logP async output multi-step mm best-of beam-search prompt-embeds
CP
APC
LoRA
SD
CUDA graph
pooling 🟠* 🟠*
enc-dec
logP
prmpt logP
async output
multi-step
mm 🟠^
best-of
beam-search
prompt-embeds

* 分塊預填充和字首快取僅適用於因果注意力機制的最後一個 token 或全部 pooling。
^ LoRA 僅適用於多模態模型的語言主幹。

特性 x 硬體

功能 Volta Turing Ampere Ada Hopper CPU AMD Intel GPU
CP
APC
LoRA
SD 🟠
CUDA graph
pooling
enc-dec
mm
prompt-embeds
logP
prmpt logP
async output
multi-step
best-of
beam-search

注意

有關 Google TPU 上功能支援的資訊,請參閱 TPU-Inference 推薦模型和功能 文件。