llmcompressor.modeling.qwen3_moe
类
-
CalibrationQwen3MoeSparseMoeBlock–Qwen3MoeSparseMoeBlock 的校准版本,该版本将所有 token 发送到所有 expert。
CalibrationQwen3MoeSparseMoeBlock
CalibrationQwen3MoeSparseMoeBlock(
original: Qwen3MoeSparseMoeBlock,
config: Qwen3MoeConfig,
calibrate_all_experts: bool = True,
)
Qwen3MoeSparseMoeBlock 的校准版本,该版本将所有 token 发送到所有 expert。