esc

请输入并搜索

DL论文

61 文章 × 9337 字

glm 4.6GLM大模型智能模型更新+2

从信息论角度看Chain-of-Thought

信息论Chain-of-Thought信息增益+2

EIGEN-1 一个agent框架

eigen 1 agent框架边想边查监控器系统层次化精炼互相帮改+2

模型模仿的虚假承诺：开源大语言模型的发展困境与出路

模型模仿的虚假承诺开源大语言模型大语言模型发展困境+2

大型语言模型尚无法实现推理自纠错！

大型语言模型自我纠错GPT-3.5+2

Qwen3 论文解读——think/no think的失败

qwen3论文解读qwen3模型训练thinknothink失败原因+2

【知识点】DeepSeek R1 解读2

deepseek-r1强化学习人工智能+2

Context engineering

context engineeringai agentlong horizon reasoning+2

Pre-training under infinite compu

高质量数据有限无限算力语言模型预训练+2

UI-Venus Technical Report

ui-venusgrpo公式交并比+2

Dong

个人博客|深度学习|编程开发|嵌入电子|自动控制|算法深耕|