ms-swift 数据打包(Packing)
2026-01-12
ms-swift
00

ms-swift export 导出packing数据:

bash
展开代码
# Qwen3-VL 多模态模型导出 cached_dataset IMAGE_MAX_TOKEN_NUM=5000 \ MAX_PIXELS=1003520 \ VIDEO_MAX_TOKEN_NUM=128 \ FPS_MAX_FRAMES=16 \ swift export \ --model /mnt/jfs6/model/Qwen3-VL-8B-Instruct/ \ --dataset 'your_dataset_name' \ --split_dataset_ratio 0 \ --dataset_num_proc 16 \ --max_length 10240 \ --to_cached_dataset true \ --output_dir /path/to/output/cached_dataset

训练时候使用:

bash
展开代码
# 训练时使用 IMAGE_MAX_TOKEN_NUM=5000 \ MAX_PIXELS=1003520 \ VIDEO_MAX_TOKEN_NUM=128 \ FPS_MAX_FRAMES=16 \ swift sft \ --model /mnt/jfs6/model/Qwen3-VL-8B-Instruct/ \ --cached_dataset '/mnt/jfs6/g-xiedong/cached_dataset/train' \ --cached_val_dataset '/mnt/jfs6/g-xiedong/cached_dataset/val' \ --packing true \ --packing_num_proc 64 \ --max_length 10240 \

IMAGE_MAX_TOKEN_NUM、max_length 需要一致 !

如果对你有用的话,可以打赏哦
打赏
ali pay
wechat pay

本文作者:Dong

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC。本作品采用《知识共享署名-非商业性使用 4.0 国际许可协议》进行许可。您可以在非商业用途下自由转载和修改,但必须注明出处并提供原作者链接。 许可协议。转载请注明出处!