llmcompressor.transformers.data.cnn_dailymail
类
-
CNNDailyMailDataset–CNN/DailyMail 数据集的文本生成类
CNNDailyMailDataset
CNN/DailyMail 数据集的文本生成类
参数
-
(dataset_argsDatasetArguments) –数据集加载的配置设置
-
(splitstr) –从数据集中加载的拆分,例如
test或train[:5%] -
(processorProcessor) –要在数据集上使用的处理器或分词器