llmcompressor.modeling.qwen3_next_moe
类
-
CalibrationQwen3NextSparseMoeBlock–Qwen3NextSparseMoeBlock 的校准版本,将所有 token 发送给所有专家。
CalibrationQwen3NextSparseMoeBlock
CalibrationQwen3NextSparseMoeBlock(
original: Qwen3NextSparseMoeBlock,
config: Qwen3NextConfig,
calibrate_all_experts: bool = True,
)
Qwen3NextSparseMoeBlock 的校准版本,将所有 token 发送给所有专家。