llmcompressor.observers.min_max
类
-
MemorylessMinMaxObserver–通过取观察值的最小值/最大值来计算量化参数
-
MinMaxObserver–通过取所有最小值/最大值的移动平均值来计算量化参数
-
StaticMinMaxObserver–通过取所有观察值的最小值/最大值来计算量化参数
MemorylessMinMaxObserver
MemorylessMinMaxObserver(
base_name: str,
args: QuantizationArgs,
module: Optional[Module] = None,
**observer_kwargs,
)
基类:Observer
通过取观察值的最小值/最大值来计算量化参数
参数
-
(base_namestr) –用于命名观察器属性的字符串
-
(argsQuantizationArgs) –用于校准和量化观测值的量化参数
-
(moduleOptional[Module], 默认值:None) –可选模块,附带量化参数。此参数是利用现有 qparams(例如 global_scale 或 g_idx)所必需的
-
–**observer_kwargs观察器初始化关键字参数
源代码位于 llmcompressor/observers/base.py
MinMaxObserver
MinMaxObserver(
base_name: str,
args: QuantizationArgs,
module: Optional[Module] = None,
**observer_kwargs,
)
通过取所有最小值/最大值的移动平均值来计算量化参数
参数
-
(base_namestr) –用于命名观察器属性的字符串
-
(argsQuantizationArgs) –用于校准和量化观测值的量化参数
-
(moduleOptional[Module], 默认值:None) –可选模块,附带量化参数。此参数是利用现有 qparams(例如 global_scale 或 g_idx)所必需的
-
–**observer_kwargs观察器初始化关键字参数
源代码位于 llmcompressor/observers/moving_base.py
StaticMinMaxObserver
基类:Observer
通过取所有观察值的最小值/最大值来计算量化参数
参数
-
–base_name用于命名观察器属性的字符串
-
–args用于校准和量化观测值的量化参数
-
–module可选模块,附带量化参数。此参数是利用现有 qparams(例如 global_scale 或 g_idx)所必需的
-
–**observer_kwargs观察器初始化关键字参数