编辑
2025-05-13
深度学习
00

目录

1. 本次更改了数据集
2. 启动训练
3. 导出

【训练】Qwen2.5VL 多机多卡 Grounding Box定位(1):http://101.126.150.28:7878/post/2067

【训练】Qwen2.5VL 多机多卡 Grounding Box定位(2):http://101.126.150.28:7878/post/2094

1. 本次更改了数据集

类似这样:

json
{ "messages": [ { "content": "<image>点[56,259]所处位置(也即是图中绿色五角星中心所处位置)的信息是什么?需要优先匹配最近UI元素的box。", "role": "user" }, { "content": "<ref>文本-地址</ref><box>[[33, 241, 66, 264]]</box>", "role": "assistant" } ], "images": [ "/img_datasets/img_small_size_28_prompt/000001.jpg" ] }

2. 启动训练

bash
cd LLaMA-Factory docker run -it --gpus '"device=0,2,3,4,5,6,7"' \ -v /data/xiedong/train_qwenvl25_for_grounding/data_train_2_prompt:/app/data \ -v ./output:/app/output \ -v ./examples:/app/examples \ -v /data/xiedong/train_qwenvl25_for_grounding:/img_datasets \ -v /data/xiedong/LLaMA-Factory/output/new_no_freeze:/Qwen2.5-VL-7B-Instruct \ --shm-size 32G \ -p 8034:7860 \ -p 8035:8000 \ kevinchina/deeplearning:llamafactory20250311-3-swanlab bash
bash
export SWANLAB_API_KEY=pM7Xvs5OS2EeXPO5gKXfJ # 设置在线跟踪模式API,这里我随便填的 export SWANLAB_LOG_DIR=/swanlab_log # 设置本地日志存储路径 export SWANLAB_MODE=cloud # 包含四种模式:cloud云端跟踪模式(默认)、cloud-only仅云端跟踪本地不保存文件、local本地跟踪模式、disabled完全不记录用于debug export SWANLAB_NAME="train2_prompt" # 设置实验名称 llamafactory-cli train \ --stage sft \ --do_train True \ --model_name_or_path output/56982 \ --preprocessing_num_workers 64 \ --finetuning_type full \ --template qwen2_vl \ --flash_attn auto \ --dataset_dir data \ --dataset grounding1 \ --cutoff_len 4096 \ --learning_rate 5e-05 \ --num_train_epochs 2.0 \ --per_device_train_batch_size 2 \ --gradient_accumulation_steps 4 \ --lr_scheduler_type cosine \ --max_grad_norm 1.0 \ --logging_steps 5 \ --save_steps 1000 \ --warmup_steps 0 \ --packing False \ --report_to none \ --output_dir output/train2_prompt \ --bf16 True \ --plot_loss True \ --trust_remote_code True \ --ddp_timeout 180000000 \ --include_num_input_tokens_seen True \ --optim adamw_torch \ --deepspeed cache/ds_z2_config.json \ --use_swanlab True \ --swanlab_project llamafactory \ --swanlab_mode cloud \ --save_total_limit=1 \ --load_best_model_at_end=False \ --metric_for_best_model="eval_loss" \ --greater_is_better=False \ --freeze_vision_tower False \ --image_max_pixels 1048576

3. 导出

llamafactory-cli export \ --model_name_or_path /app/output/new_no_freeze/checkpoint-56982 \ --template qwen2_vl \ --finetuning_type full \ --export_dir output/56982 \ --export_size 5 \ --export_device cpu \ --export_legacy_format false
如果对你有用的话,可以打赏哦
打赏
ali pay
wechat pay

本文作者:Dong

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC。本作品采用《知识共享署名-非商业性使用 4.0 国际许可协议》进行许可。您可以在非商业用途下自由转载和修改,但必须注明出处并提供原作者链接。 许可协议。转载请注明出处!