llmcompressor.observers.moving_base
类
-
MovingAverageObserverBase–通过对最小/最大值进行移动平均来计算量化参数
MovingAverageObserverBase
MovingAverageObserverBase(
base_name: str,
args: QuantizationArgs,
module: Optional[Module] = None,
**observer_kwargs,
)
基类:Observer
通过对最小/最大值进行移动平均来计算量化参数
参数
-
(base_namestr) –用于命名观察器属性的字符串
-
(argsQuantizationArgs) –用于校准和量化观测值的量化参数
-
(moduleOptional[Module], 默认值:None) –可选模块,附带量化参数。此参数是利用现有 qparams(例如 global_scale 或 g_idx)所必需的
-
–**observer_kwargs观察器初始化关键字参数
方法
-
get_current_global_min_max–计算观测值的最小值和最大值(不带移动平均)
-
get_current_min_max–计算观测值的最小值和最大值(不带移动平均)
-
get_global_min_max–计算从观测值中获取的最小值和最大值的移动平均
-
get_min_max–计算从观测值中获取的最小值和最大值的移动平均
源代码位于 llmcompressor/observers/moving_base.py
get_current_global_min_max abstractmethod
计算观测值的最小值和最大值(不带移动平均),用于全局尺度计算
源代码位于 llmcompressor/observers/moving_base.py
get_current_min_max abstractmethod
get_global_min_max
计算从观测值中获取的最小值和最大值的移动平均,用于全局尺度计算
参数
-
(observedTensor) –被观测的值,形状为 (num_observations, 1, group_size)
返回
-
MinMaxTuple–最小值和最大值,其形状为 (1, )
源代码位于 llmcompressor/observers/moving_base.py
get_min_max
计算从观测值中获取的最小值和最大值的移动平均
参数
-
(observedTensor) –被观测的值,形状为 (num_observations, *qparam_shape, group_size)
返回
-
MinMaxTuple–最小值和最大值,其形状为 (*qparam_shape, )