跳到内容

vllm bench sweep plot

JSON 命令行参数

当传递 JSON 命令行参数时,以下几组参数是等效的

  • --json-arg '{"key1": "value1", "key2": {"key3": "value2"}}'
  • --json-arg.key1 value1 --json-arg.key2.key3 value2

此外,列表元素可以使用 + 单独传递

  • --json-arg '{"key4": ["value3", "value4", "value5"]}'
  • --json-arg.key4+ value3 --json-arg.key4+='value4,value5'

参数

--fig-dir

用于保存图表的目录,相对于 OUTPUT_DIR。默认使用同一目录。
默认值: ""

--fig-by

以逗号分隔的变量列表,将为这些变量的每一种组合创建一个单独的图表。
默认值: ""

--row-by

以逗号分隔的变量列表,将为这些变量的每一种组合创建一个单独的行。
默认值: ""

--col-by

以逗号分隔的变量列表,将为这些变量的每一种组合创建一个单独的列。
默认值: ""

--curve-by

以逗号分隔的变量列表,将为这些变量的每一种组合创建一条单独的曲线。

--var-x

X 轴对应的变量。
默认值: total_token_throughput

--var-y

Y 轴对应的变量。
默认值: median_ttft_ms

--filter-by

以逗号分隔的语句列表,用于指定过滤条件。这对于剔除异常值非常有用。示例:max_concurrency<1000,max_num_batched_tokens<=4096 表示仅绘制 max_concurrency 小于 1000 且 max_num_batched_tokens 不大于 4096 的数据点。
默认值: ""

--bin-by

以逗号分隔的语句列表,用于指定分箱(binning)条件。这有助于避免绘制过于密集的数据点。示例:request_throughput%%1 表示对 request_throughput 变量使用大小为 1 的箱。
默认值: ""

--scale-x

用于 X 轴的缩放比例。目前仅接受字符串值,如 'log' 和 'sqrt'。另请参阅:https://seaborn.org.cn/generated/seaborn.objects.Plot.scale.html

--scale-y

用于 Y 轴的缩放比例。目前仅接受字符串值,如 'log' 和 'sqrt'。另请参阅:https://seaborn.org.cn/generated/seaborn.objects.Plot.scale.html

--fig-name

输出图表文件的前缀名称。存在分组数据时会自动追加。默认值: 'FIGURE'。示例:--fig-name my_performance_plot
默认值: FIGURE

--no-error-bars

如果设置此项,则禁用图表上的误差棒。默认情况下会显示误差棒。
默认值: False

--fig-height

每个子图的高度(英寸)。默认值: 6.4
默认值: 6.4

--fig-dpi

输出图表的分辨率(每英寸点数)。默认值: 300
默认值: 300

--dry-run

如果设置此项,则打印每个待绘制图表的信息,然后退出,不进行绘图。
默认值: False