2026-01-09
Docker
00
bash
展开代码
sudo apt-get install -y jq
bash
展开代码
# 更清晰的统计 docker image inspect kevinchina/deeplearning:llamafactory0-9-4-base-1-megatron-1-ok-tars1 | jq -r '.[0].RootFS.Layers | length'
2026-01-09
Python
00

使用 Hugging Face API 操作仓库指南

简介

本文介绍如何使用 Hugging Face API 通过 Python 直接操作 Hugging Face 仓库(模型或数据集),包括上传、删除、列出文件等常见操作。这种方法比使用命令行工具更灵活,特别适合批量操作和自动化脚本。

2026-01-08
LLaMA-Factory
00

laolao77/MMDU

https://huggingface.co/datasets/laolao77/MMDU/viewer/MMDU/train?row=0

bash
展开代码
./hfd.sh laolao77/MMDU --dataset --local-dir /data/xiedong/mmdu/
2026-01-08
LLaMA-Factory
00

LLamaFactory

本地示例数据集(可直接使用)

data 目录下有以下测试

2026-01-05
LLaMA-Factory
00

单机4卡训练 LLaMAFactory Megatron 速度如何?这篇做了测试。

MCA

2026-01-04
LLaMA-Factory
00

1. Dockerfile.megatron 是什么?

`Dockerfile.megat

2025-12-30
深度学习
00

用一个具体例子详细说明 GSPO 的两个变体的计算过程,特别是 token 级别的重要性比率是如何得

2025-12-30
深度学习
00

引言

在大语言模型的强化学习训练中,如何设计一个既稳定又高效的目标函数一直是核心挑战。N

2025-12-30
深度学习
00

深入理解奖励模型:从训练到RLHF应用

基于Nemotron-Cascade论文解析奖励模

2025-12-30
深度学习
00

奖励塑形(Reward Shaping)技术解释

**奖励塑形(Reward Shaping