Press
esc
to close
请输入并搜索
Dong
Dong
首页
标签
分类
时间线
友链
动态
工具
联系我
Press
Ctrl
+
and
K
to search
深度学习
Linux运维
单片机
Python
CPP
Android/Java
Docker
OpenCV
Matlab
售卖作品
深度学习ban
单片机ban
DL论文
建站教程
树莓派
算法刷题
提示词工程
数学之美
工具使用
课程学习
见闻录
备忘录
隐藏机密
自动控制
摄影技巧
Git
LLaMA-Factory
ROS
GRPO
Vanblog
Distill
usefulScripts
首页
标签
分类
时间线
友链
动态
工具
联系我
DL论文
52 文章 × 289631 字
2025-10-21
DeepSeek-OCR:光学压缩技术开辟文本处理新范式
deepseek-ocr
视觉-文本压缩
deepencoder架构
+2
2025-10-10
GLM-4.6
glm 4.6
GLM大模型
智能模型更新
+2
2025-10-09
从信息论角度看Chain-of-Thought
信息论
Chain-of-Thought
信息增益
+2
2025-09-29
EIGEN-1 一个agent框架
eigen 1 agent框架
边想边查监控器系统
层次化精炼互相帮改
+2
2025-09-25
模型模仿的虚假承诺:开源大语言模型的发展困境与出路
模型模仿的虚假承诺
开源大语言模型
大语言模型发展困境
+2
2025-09-25
大型语言模型尚无法实现推理自纠错!
大型语言模型
自我纠错
GPT-3.5
+2
2025-09-23
Qwen3 论文解读——think/no think的失败
qwen3论文解读
qwen3模型训练
thinknothink失败原因
+2
2025-09-23
【知识点】DeepSeek R1 解读2
deepseek-r1
强化学习
人工智能
+2
2025-09-19
Context engineering
context engineering
ai agent
long horizon reasoning
+2
2025-09-19
Pre-training under infinite compu
高质量数据有限
无限算力
语言模型预训练
+2
2025-08-18
UI-Venus Technical Report
ui-venus
grpo公式
交并比
+2
2025-08-15
论文 AgentCPM-GUI
agentcpm-gui
清华大学thunlp实验室
中文app操作
+2
2025-04-30
YaRN:大型语言模型的高效上下文窗口扩展
yarn方法
上下文窗口扩展
rope嵌入优化
+2
2025-04-03
【知识点】DeepSeek R1 解读1
deepseek r1 解读
群组相对策略优化 grpo
强化学习训练优化
+2
2025-02-19
DeepSeekMoE
deepseekmoe架构
混合专家模型优化
细粒度专家分割
+2
2025-02-19
DeepSeek 系列论文解读
deepseek 系列模型解析
deepseek moe 架构优化
混合专家模型训练技巧
+2
2025-02-17
Infinity 自回归模型生图 论文观点
infinity自回归模型
比特级图像生成
高分辨率图像合成
+2
2025-02-17
Fluid 自回归模型生图 论文观点
fluid模型架构
连续标记图像生成
随机顺序自回归模型
+3
2025-01-20
DDColor 通用场景黑白图片上色 论文点
ddcolor 图像上色技术
transformer 图像上色
双解码器上色模型
+2
2025-01-17
cyclegan 循环一致性对抗网络 论文点
cyclegan 原理
图像到图像转换
对抗生成网络 gans
+2
2025-01-16
【论文】pix2pix PatchGAN
pix2pix图像上色
cgan图像生成
patchgan判别器
+2
2025-01-13
大模型LLM综述 论文翻译
大模型综述
大型语言模型能力分析
llm扩展机制
+2
2024-11-26
AnyGPT 论文解析
anygpt论文解析
多模态离散化技术
统一多模态语言模型
+2
2024-11-26
Spirit LM 语音-文本 多模态模型
spirit lm 多模态模型
语音文本交替训练
llma2 语音扩展
+2
2024-11-19
ESRL 论文解析
esrl论文解析
强化学习序列生成
两阶段采样技术
+2
2024-11-19
agent- Claude 3.5计算机使用 论文解析
claude 3.5 计算机使用
gui自动化模型
api驱动桌面操作
+2
2024-11-19
LLaVA-o1 论文解析
llava-o1 论文解析
视觉语言模型推理
结构化多阶段推理
+2
2024-11-14
ChatGLM 大海捞针
chatglm技术发展
chatglm模型架构
chatglm预训练数据
+2
2024-11-14
SoM 什么是SoM?
som提示方法
图像标记技术
gpt-4v视觉模型
+2
2024-11-14
CoT Chain-of-Thought 论文解析
cot论文解析
chain-of-thought prompting
大型语言模型推理
+2
2024-11-14
ReAct 论文解析
react框架
大语言模型推理
reasoning and acting
+2
2024-11-14
ANDROID LAB 论文重点
android lab论文分析
android instruct数据集
android操作模式研究
+2
2024-11-12
Ovis,多模态大模型论文
ovis多模态大模型
结构化视觉嵌入
多模态语言模型架构
+2
2024-11-12
AndroidLab
android 自动化框架
android lab 开源项目
android 智能代理评估
+2
2024-11-12
LLM小模型综述,模型一览
llm模型压缩技术
小语言模型优化
知识蒸馏方法
+2
2024-10-30
AppAgent 腾讯实验室
appagent 腾讯实验室
多模态代理框架
智能手机应用操作
+2
2024-10-30
mobile-agent v2 阿里 android app agents
mobile agent v2
多智能体架构
移动设备操作助手
+2
2024-10-30
mobile-agent 阿里 android app agents
mobile agent技术
android app自动化
多模态大模型应用
+2
2024-10-29
lightweight neural app control 华为 AI-Agent
lightweight neural app control
华为 ai-agent
多模态应用控制架构
+2
2024-10-24
Class-RAG 论文点
class-rag论文解析
内容审核分类器
retrieval-augmented generation
+2
2024-10-16
DistilBERT 论文点
distilbert 模型压缩
知识蒸馏 nlp
bert 轻量化
+2
2024-10-16
ALBERT 论文点
albert论文解析
albert模型优化
分解嵌入参数化
+4
2024-10-16
RoBERTa 论文点
roberta 论文解析
nlp 预训练模型
bert 优化技术
+2
2024-10-16
DINOv2 论文点
dinov2论文解析
自监督视觉学习
图像特征提取技术
+2
2024-10-16
SimSIAM 论文点
simsiam论文解读
simsiam创新点
simsiam无监督学习
+2
2024-10-16
BYOL 论文点
byol 自监督学习
byol 架构详解
自蒸馏 无负样本
+2
2024-10-16
NNCLR 论文点
nnclr论文解读
对比学习方法
自监督学习
+2
2024-10-16
SimCLR 论文中文翻译
simclr论文解析
对比学习框架
自监督视觉表征
+2
2024-09-24
深度学习,Moshi:实时语音到语音生成 Transformer 开源模型
翻译论文
2024-09-24
Qwen2.5-Coder Technical Report
翻译论文
2024-09-18
MemoRAG:利用长期记忆来增强LLM的能力
MemoRAG
2024-09-18
Agent Workflow Memory:智能体工作流
智能体工作流
Dong
个人博客|深度学习|编程开发|嵌入电子|自动控制|算法深耕|
2257
日志
32
分类
5205
标签