Press
esc
to close
请输入并搜索
Dong
Dong
首页
标签
分类
时间线
友链
动态
工具
联系我
Press
Ctrl
+
and
K
to search
深度学习
Linux运维
单片机
Python
CPP
Android/Java
Docker
OpenCV
Matlab
售卖作品
深度学习ban
单片机ban
DL论文
建站教程
树莓派
算法刷题
提示词工程
数学之美
工具使用
课程学习
见闻录
备忘录
隐藏机密
自动控制
摄影技巧
Git
LLaMA-Factory
ROS
GRPO
Vanblog
Distill
usefulScripts
ms-swift
PAI
首页
标签
分类
时间线
友链
动态
工具
联系我
DL论文
61 文章 × 9337 字
2025-10-10
GLM-4.6
glm 4.6
GLM大模型
智能模型更新
+2
2025-10-09
从信息论角度看Chain-of-Thought
信息论
Chain-of-Thought
信息增益
+2
2025-09-29
EIGEN-1 一个agent框架
eigen 1 agent框架
边想边查监控器系统
层次化精炼互相帮改
+2
2025-09-25
模型模仿的虚假承诺:开源大语言模型的发展困境与出路
模型模仿的虚假承诺
开源大语言模型
大语言模型发展困境
+2
2025-09-25
大型语言模型尚无法实现推理自纠错!
大型语言模型
自我纠错
GPT-3.5
+2
2025-09-23
Qwen3 论文解读——think/no think的失败
qwen3论文解读
qwen3模型训练
thinknothink失败原因
+2
2025-09-23
【知识点】DeepSeek R1 解读2
deepseek-r1
强化学习
人工智能
+2
2025-09-19
Context engineering
context engineering
ai agent
long horizon reasoning
+2
2025-09-19
Pre-training under infinite compu
高质量数据有限
无限算力
语言模型预训练
+2
2025-08-18
UI-Venus Technical Report
ui-venus
grpo公式
交并比
+2
‹
1
2
3
4
5
6
7
›
Dong
个人博客|深度学习|编程开发|嵌入电子|自动控制|算法深耕|
2361
日志
34
分类
5272
标签