llmcompressor.pytorch.utils.sparsification_info.helpers
函数
-
get_leaf_operations–获取模型中的叶子操作
-
get_precision_information–获取操作精度信息。
-
is_quantized–检查操作是否已量化(包含
get_leaf_operations
get_leaf_operations(
model: Module,
operations_to_skip: Optional[List[Module]] = None,
operations_to_unwrap: Optional[List[Module]] = None,
) -> List[torch.nn.Module]
获取模型中的叶子操作(那些没有子操作的操作)
参数
-
(modelModule) –模型以从模型中获取叶子操作
-
(operations_to_skipOptional[List[Module]], default:None) –在获取叶子操作时将被忽略的叶子操作列表。如果传递 None,则默认跳过 Identity 操作。
-
(operations_to_unwrapOptional[List[Module]], default:None) –在获取叶子操作时将被解开的操作列表。解开意味着我们将直接将操作包装(即操作的 `module` 属性)的操作添加到叶子操作列表中。如果传递 None,则默认解开 QuantWrapper 操作。
返回
-
List[Module]–叶子操作列表
Source code in llmcompressor/pytorch/utils/sparsification_info/helpers.py
get_precision_information
获取操作精度信息。
1) 如果操作已量化,则返回操作的量化方案。 2) 如果操作未量化,则返回操作权重的位数。 3) 如果操作未量化且没有权重,则返回 None。
参数
-
(operationModule) –要从中获取量化方案的操作
返回
-
Union[None, int, QuantizationScheme]–操作的量化方案,操作权重的位数,或 None(如果操作未量化且没有权重)