在 VS Code 的扩展市场中,最核心的 Python 开发扩展是由 Microsoft 官方维护的 ms-python.python(名称直接叫 "Python")。以下是关键扩展的区分和推荐:
1. 必装的核心扩展
✅ Python
• 发布者: ms-python(Microsoft 官方)
• 功能:
• Python 语言基础支持(语法高亮、代码补全、调试等)。
• 集成 Python 解释器管理(切换虚拟环境、conda 等)。
• 提供 Jupyter Notebook 支持。
• 标识:扩展列表中直接显示为 "Python",且作者是 ms-python。
在之前博客进行了简单的训练尝试:https://www.dong-blog.fun/post/2060
在本博客,将会深入进行多机多卡训练,以及调整训练奖励函数。
之前构建了镜像: docker build . -t kevinchina/deeplearning:r1
展开代码FROM hiyouga/verl:ngc-th2.6.0-cu126-vllm0.8.4-flashinfer0.2.2-cxx11abi0 WORKDIR /workplace RUN git clone https://github.com/hiyouga/EasyR1.git WORKDIR /workplace/EasyR1 RUN pip install -e . -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple RUN pip install swanlab -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple
多机多卡的rbma通信条件在这个镜像也具备: apt-get install libibverbs1 -y
项目地址:
https://github.com/hiyouga/EasyR1?tab=readme-ov-file#custom-dataset
拉取镜像:
展开代码docker pull hiyouga/verl:ngc-th2.6.0-cu126-vllm0.8.4-flashinfer0.2.2-cxx11abi0
做一个镜像:
展开代码FROM hiyouga/verl:ngc-th2.6.0-cu126-vllm0.8.4-flashinfer0.2.2-cxx11abi0 WORKDIR /workplace RUN git clone https://github.com/hiyouga/EasyR1.git WORKDIR /workplace/EasyR1 RUN pip install -e . -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple RUN pip install swanlab -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple
grpo_config.py
dict[str, Any] 或 None,默认值 None
transformers.AutoModelForCausalLM.from_pretrained的关键字参数,当GRPOTrainer的model参数提供为字符串时使用。remove_unused_columns: bool,默认值 False
False。max_prompt_length: int 或 None,默认值 512
num_generations: int 或 None,默认值 8
temperature: float,默认值 0.9
max_completion_length: int 或 None,默认值 256
ds3_gather_for_generation: bool,默认值 True
在使用 vLLM 部署大型语言模型(LLM)时,我们经常会接触到模型目录下的各种配置文件。其中,tokenizer_config.json 是一个至关重要的文件,它像一座桥梁,连接着人类可读的文本与模型内部能理解的数字表示。本文将以部署 Qwen3-30B-A3B 模型为例,深入探讨 tokenizer_config.json 在 vLLM 中的作用以及其内部各项配置的含义。