llmcompressor.modifiers.awq.mappings
类
-
AWQMapping–存储要平滑的激活配置的数据类
函数
-
get_layer_mappings_from_architecture–:param architecture: str: 模型的架构
AWQMapping dataclass
存储要平滑的激活配置的数据类。smooth_layer 的输出激活是 balance_layers 的输入激活。
AWQMappings 会被解析成 ResolvedMappings,后者在运行时保留指向实际 torch.nn.Modules 和附加元数据的指针。
ResolvedMapping dataclass
ResolvedMapping(
smooth_name: str,
smooth_layer: Module,
balance_layers: list[Module],
balance_names: list[str],
parent: Module,
parent_name: str,
)
用于存储激活层与在平滑期间必须平衡的后续权重之间的已解析映射的数据类。
参数
-
(smooth_namestr) –激活层的名称
-
(smooth_layerModule) –存储激活层的 PyTorch 模块
-
(balance_layerslist[Module]) –smooth_layer 输入到的 PyTorch 模块列表,必须进行平衡以抵消 smooth_layer 的平滑
-
(balance_nameslist[str]) –可选的 balance_layers 名称列表。
-
(parentModule) –balance_layers 的父模块。
-
(parent_namestr) –父模块的名称。
get_layer_mappings_from_architecture
参数
-
(architecturestr) –str: 模型的架构
返回
-
list[AWQMapping]–list: 给定架构的层映射