llmcompressor.modifiers.utils.pytorch_helpers
PyTorch 特定的模型压缩辅助函数。
提供 PyTorch 模型操作的实用函数,包括批处理、填充掩码应用和模型架构检测。支持 MoE(专家混合)模型和用于压缩工作流的专用张量操作。
函数
-
apply_pad_mask_to_batch–将掩码应用于批次的输入 ID。这用于将填充标记清零,
-
is_moe_model–检查模型是否为专家混合模型
apply_pad_mask_to_batch
将掩码应用于批次的输入 ID。这用于将填充标记清零,以免它们对 GPTQ 和 SparseGPT 算法中的 Hessian 计算产生贡献。
假设 attention_mask 只包含零和一。
参数
-
(batchDict[str, Tensor]) –如果存在,则应用于填充的批次。
返回
-
Dict[str, Tensor]–input_ids 中填充已清零的批次。
源文件位于 llmcompressor/modifiers/utils/pytorch_helpers.py
is_moe_model
检查模型是否为专家混合模型
参数
-
(modelModule) –要检查的模型
返回
-
bool–如果模型是专家混合模型,则为 True。