来源 examples/online_serving/prometheus_grafana

Prometheus 和 Grafana#

这是一个简单的示例,展示了如何将 vLLM 指标日志记录连接到 Prometheus/Grafana 堆栈。 在此示例中,我们通过 Docker 启动 Prometheus 和 Grafana。 您可以通过 PrometheusGrafana 网站查看其他方法。

安装

启动#

OpenAI 兼容服务器中默认启用 Prometheus 指标日志记录。 通过入口点启动

vllm serve mistralai/Mistral-7B-v0.1 \
    --max-model-len 2048 \
    --disable-log-requests

使用 docker compose 启动 Prometheus 和 Grafana 服务器

docker compose up

向服务器提交一些示例请求

wget https://hugging-face.cn/datasets/anon8231489123/ShareGPT_Vicuna_unfiltered/resolve/main/ShareGPT_V3_unfiltered_cleaned_split.json

python3 ../../../benchmarks/benchmark_serving.py \
    --model mistralai/Mistral-7B-v0.1 \
    --tokenizer mistralai/Mistral-7B-v0.1 \
    --endpoint /v1/completions \
    --dataset-name sharegpt \
    --dataset-path ShareGPT_V3_unfiltered_cleaned_split.json \
    --request-rate 3.0

导航到 https://127.0.0.1:8000/metrics 将显示 vLLM 公开的原始 Prometheus 指标。

Grafana 仪表板#

导航到 https://127.0.0.1:3000。 使用默认用户名 (admin) 和密码 (admin) 登录。

添加 Prometheus 数据源#

导航到 https://127.0.0.1:3000/connections/datasources/new 并选择 Prometheus。

在 Prometheus 配置页面上,我们需要在 Connection 中添加 Prometheus Server URL。 对于此设置,Grafana 和 Prometheus 在单独的容器中运行,但 Docker 为每个容器创建 DNS 名称。 您可以直接使用 http://prometheus:9090

点击 Save & Test。 您应该看到一个绿色复选标记,显示“Successfully queried the Prometheus API.”。

导入仪表板#

导航到 https://127.0.0.1:3000/dashboard/import,上传 grafana.json,然后选择 prometheus 数据源。 您应该看到如下所示的屏幕

Grafana Dashboard Image

示例材料#