llmcompressor.transformers.data.c4
类
-
C4Dataset–C4 数据集的子文本生成类
C4Dataset
C4 数据集的子文本生成类
参数
-
(dataset_argsDatasetArguments) –数据集加载的配置设置
-
(splitstr) –从数据集中加载的拆分,例如
test或train[:5%] -
(processorProcessor) –要在数据集上使用的处理器或分词器