來源 examples/online_serving/prometheus_grafana

Prometheus 和 Grafana#

這是一個簡單的示例,展示瞭如何將 vLLM 指標日誌記錄連線到 Prometheus/Grafana 堆疊。 對於此示例,我們透過 Docker 啟動 Prometheus 和 Grafana。 您可以透過 PrometheusGrafana 網站檢視其他方法。

安裝

啟動#

Prometheus 指標日誌記錄在 OpenAI 相容伺服器中預設啟用。 透過入口點啟動

vllm serve mistralai/Mistral-7B-v0.1 \
    --max-model-len 2048 \
    --disable-log-requests

使用 docker compose 啟動 Prometheus 和 Grafana 伺服器

docker compose up

向伺服器提交一些示例請求

wget https://huggingface.tw/datasets/anon8231489123/ShareGPT_Vicuna_unfiltered/resolve/main/ShareGPT_V3_unfiltered_cleaned_split.json

python3 ../../../benchmarks/benchmark_serving.py \
    --model mistralai/Mistral-7B-v0.1 \
    --tokenizer mistralai/Mistral-7B-v0.1 \
    --endpoint /v1/completions \
    --dataset-name sharegpt \
    --dataset-path ShareGPT_V3_unfiltered_cleaned_split.json \
    --request-rate 3.0

導航到 https://:8000/metrics 將顯示 vLLM 公開的原始 Prometheus 指標。

Grafana 儀表板#

導航到 https://:3000。 使用預設使用者名稱 (admin) 和密碼 (admin) 登入。

新增 Prometheus 資料來源#

導航到 https://:3000/connections/datasources/new 並選擇 Prometheus。

在 Prometheus 配置頁面上,我們需要在 Connection 中新增 Prometheus 伺服器 URL。 對於此設定,Grafana 和 Prometheus 在單獨的容器中執行,但 Docker 為每個容器建立 DNS 名稱。 您可以直接使用 http://prometheus:9090

點選 Save & Test。 您應該看到綠色的勾號,顯示“Successfully queried the Prometheus API.”(成功查詢 Prometheus API)。

匯入儀表板#

導航到 https://:3000/dashboard/import,上傳 grafana.json,然後選擇 prometheus 資料來源。 您應該看到如下所示的螢幕

Grafana Dashboard Image

示例材料#