跳到内容

vllm bench sweep plot

JSON 命令行参数

当传递 JSON 命令行参数时,以下几组参数是等效的

  • --json-arg '{"key1": "value1", "key2": {"key3": "value2"}}'
  • --json-arg.key1 value1 --json-arg.key2.key3 value2

此外,列表元素可以使用 + 单独传递

  • --json-arg '{"key4": ["value3", "value4", "value5"]}'
  • --json-arg.key4+ value3 --json-arg.key4+='value4,value5'

参数

--fig-dir

用于保存图表的目录,相对于 OUTPUT_DIR。默认情况下,使用同一目录。

默认值: ""

--fig-by

一组用逗号分隔的变量,将为这些变量的每种组合创建一个单独的图表。

默认值: ""

--row-by

一组用逗号分隔的变量,将为这些变量的每种组合创建一个单独的行。

默认值: ""

--col-by

一组用逗号分隔的变量,将为这些变量的每种组合创建一个单独的列。

默认值: ""

--curve-by

一组用逗号分隔的变量,将为这些变量的每种组合创建一个单独的曲线。

默认值: None

--var-x

x 轴的变量。

默认值:request_throughput

--var-y

y 轴的变量

默认值:p99_e2el_ms

--filter-by

一组用逗号分隔的语句,指示要过滤的值。这有助于移除异常值。例如:max_concurrency<1000,max_num_batched_tokens<=4096 表示仅绘制 max_concurrency 小于 1000 且 max_num_batched_tokens 不大于 4096 的点。

默认值: ""

--bin-by

一组用逗号分隔的语句,指示要分组的值。这有助于避免绘制过于靠近的点。例如:request_throughput%%1 表示对 request_throughput 变量使用 1 的分组大小。

默认值: ""

--scale-x

x 轴使用的刻度。目前仅接受字符串值,例如 'log' 和 'sqrt'。另请参阅:https://seaborn.org.cn/generated/seaborn.objects.Plot.scale.html

默认值: None

--scale-y

y 轴使用的刻度。目前仅接受字符串值,例如 'log' 和 'sqrt'。另请参阅:https://seaborn.org.cn/generated/seaborn.objects.Plot.scale.html

默认值: None

--fig-name

输出图表文件的名称前缀。如果存在,则始终附加组数据。默认值:'FIGURE'。例如:--fig-name my_performance_plot

默认值:FIGURE

--no-error-bars

如果设置,则禁用图表上的误差线。默认情况下,会显示误差线。

默认值: False

--fig-height

每个子图的高度(以英寸为单位)。默认值:6.4

默认值:6.4

--fig-dpi

输出图表的分辨率(以每英寸点数为单位)。默认值:300

默认值:300

--dry-run

如果设置,则打印有关每个要绘制的图表的信息,然后退出而不绘制它们。

默认值: False