llmcompressor.transformers.compression.sparsity_metadata_config
类
-
SparsityConfigMetadata–用于根据模型中的可读元数据填写 SparsityCompressionConfig 的辅助函数类
SparsityConfigMetadata
用于根据模型中的可读元数据填写 SparsityCompressionConfig 的辅助函数类
方法
-
fill_config_details–从给定模型填充信息性稀疏参数
-
from_pretrained–确定给定模型的压缩类型和信息参数
-
infer_global_sparsity–计算模型中稀疏零权重的全局百分比
-
infer_sparsity_structure–确定已应用了何种稀疏结构(如果有)。
-
is_sparse24_bitmask_supported–确定给定模型是否支持 sparse 24 bitmask 稀疏压缩器
fill_config_details staticmethod
fill_config_details(
config: SparsityCompressionConfig,
model: Module,
state_dict: dict[str, Tensor] | None = None,
)
从给定模型填充信息性稀疏参数
参数
-
(configSparsityCompressionConfig) –要填充的稀疏配置
-
(modelModule) –要从中推断配置参数的 PyTorch 模型
-
(state_dictdict[str, Tensor] | None, default:None) –用于收集全局 FSDP 模型信息的可选 state_dict,用于替换模型中的 state_dict
源文件位于 llmcompressor/transformers/compression/sparsity_metadata_config.py
from_pretrained staticmethod
from_pretrained(
model: Module,
state_dict: dict[str, Tensor] | None = None,
compress: bool = False,
quantization_format: CompressionFormat | None = None,
disable_sparse_compression: bool = False,
sparsity_structure: str | None = None,
) -> SparsityCompressionConfig | None
确定给定模型的压缩类型和信息参数
参数
-
(modelModule) –用于计算稀疏配置的 PyTorch 模型
-
(state_dictdict[str, Tensor] | None, default:None) –用于收集全局 FSDP 模型信息的可选 state_dict,用于替换模型中的 state_dict
-
(compressbool, 默认值:False) –是否在磁盘上压缩模型
-
(quantization_formatCompressionFormat | None, default:None) –模型正在使用的量化压缩格式
-
(disable_sparse_compressionbool, 默认值:False) –是否使用稀疏压缩器压缩模型,如果为 True,则稀疏压缩格式将为密集格式,默认为 False。
-
(sparsity_structurestr | None, 默认值:None) –模型的稀疏结构。直接提供它将跳过直接从模型推断的步骤
返回
-
SparsityCompressionConfig | None–从模型推断的压缩配置
源文件位于 llmcompressor/transformers/compression/sparsity_metadata_config.py
infer_global_sparsity staticmethod
计算模型中稀疏零权重的全局百分比
参数
-
(modelModule) –要从中推断稀疏度的 PyTorch 模型
-
(state_dictdict[str, Tensor] | None, default:None) –用于收集全局 FSDP 模型信息的可选 state_dict,用于替换模型中的 state_dict
返回
-
float–模型的全局稀疏度
源文件位于 llmcompressor/transformers/compression/sparsity_metadata_config.py
infer_sparsity_structure staticmethod
infer_sparsity_structure(
model: Module | None = None,
check_only_modifiers: bool | None = False,
) -> str
确定已应用了何种稀疏结构(如果有)。
首先,会尝试从当前活动的稀疏会话中推断稀疏结构。
如果失败,则从模型(如果提供)推断稀疏结构
最后,如果两者都失败,则将稀疏结构设置为“非结构化”
返回
-
str–稀疏结构(字符串格式)
源文件位于 llmcompressor/transformers/compression/sparsity_metadata_config.py
is_sparse24_bitmask_supported staticmethod
确定 vLLM 中的给定模型及其稀疏结构是否支持 sparse 24 bitmask 稀疏压缩器
参数
-
(modelModule) –用于检查 sparse 24 bit 稀疏支持的 PyTorch 模型
-
(sparsity_structurestr | None, 默认值:None) –模型的稀疏结构,如果未提供,则会进行推断
返回
-
bool–vLLM 是否支持 sparse 24 bitmask 压缩