DL论文

52 文章 × 289631 字
2025-10-21
DeepSeek-OCR:光学压缩技术开辟文本处理新范式
deepseek-ocr视觉-文本压缩deepencoder架构+2
2025-10-10
GLM-4.6
glm 4.6GLM大模型智能模型更新+2
2025-10-09
从信息论角度看Chain-of-Thought
信息论Chain-of-Thought信息增益+2
2025-09-29
EIGEN-1 一个agent框架
eigen 1 agent框架边想边查监控器系统层次化精炼互相帮改+2
2025-09-25
模型模仿的虚假承诺:开源大语言模型的发展困境与出路
模型模仿的虚假承诺开源大语言模型大语言模型发展困境+2
2025-09-25
大型语言模型尚无法实现推理自纠错!
大型语言模型自我纠错GPT-3.5+2
2025-09-23
Qwen3 论文解读——think/no think的失败
qwen3论文解读qwen3模型训练thinknothink失败原因+2
2025-09-23
【知识点】DeepSeek R1 解读2
deepseek-r1强化学习人工智能+2
2025-09-19
Context engineering
context engineeringai agentlong horizon reasoning+2
2025-09-19
Pre-training under infinite compu
高质量数据有限无限算力语言模型预训练+2
2025-08-18
UI-Venus Technical Report
ui-venusgrpo公式交并比+2
2025-08-15
论文 AgentCPM-GUI
agentcpm-gui清华大学thunlp实验室中文app操作+2
2025-04-30
YaRN:大型语言模型的高效上下文窗口扩展
yarn方法上下文窗口扩展rope嵌入优化+2
2025-04-03
【知识点】DeepSeek R1 解读1
deepseek r1 解读群组相对策略优化 grpo强化学习训练优化+2
2025-02-19
DeepSeekMoE
deepseekmoe架构混合专家模型优化细粒度专家分割+2
2025-02-19
DeepSeek 系列论文解读
deepseek 系列模型解析deepseek moe 架构优化混合专家模型训练技巧+2
2025-02-17
Infinity 自回归模型生图 论文观点
infinity自回归模型比特级图像生成高分辨率图像合成+2
2025-02-17
Fluid 自回归模型生图 论文观点
fluid模型架构连续标记图像生成随机顺序自回归模型+3
2025-01-20
DDColor 通用场景黑白图片上色 论文点
ddcolor 图像上色技术transformer 图像上色双解码器上色模型+2
2025-01-17
cyclegan 循环一致性对抗网络 论文点
cyclegan 原理图像到图像转换对抗生成网络 gans+2
2025-01-16
【论文】pix2pix PatchGAN
pix2pix图像上色cgan图像生成patchgan判别器+2
2025-01-13
大模型LLM综述 论文翻译
大模型综述大型语言模型能力分析llm扩展机制+2
2024-11-26
AnyGPT 论文解析
anygpt论文解析多模态离散化技术统一多模态语言模型+2
2024-11-26
Spirit LM 语音-文本 多模态模型
spirit lm 多模态模型语音文本交替训练llma2 语音扩展+2
2024-11-19
ESRL 论文解析
esrl论文解析强化学习序列生成两阶段采样技术+2
2024-11-19
agent- Claude 3.5计算机使用 论文解析
claude 3.5 计算机使用gui自动化模型api驱动桌面操作+2
2024-11-19
LLaVA-o1 论文解析
llava-o1 论文解析视觉语言模型推理结构化多阶段推理+2
2024-11-14
ChatGLM 大海捞针
chatglm技术发展chatglm模型架构chatglm预训练数据+2
2024-11-14
SoM 什么是SoM?
som提示方法图像标记技术gpt-4v视觉模型+2
2024-11-14
CoT Chain-of-Thought 论文解析
cot论文解析chain-of-thought prompting大型语言模型推理+2
2024-11-14
ReAct 论文解析
react框架大语言模型推理reasoning and acting+2
2024-11-14
ANDROID LAB 论文重点
android lab论文分析android instruct数据集android操作模式研究+2
2024-11-12
Ovis,多模态大模型论文
ovis多模态大模型结构化视觉嵌入多模态语言模型架构+2
2024-11-12
AndroidLab
android 自动化框架android lab 开源项目android 智能代理评估+2
2024-11-12
LLM小模型综述,模型一览
llm模型压缩技术小语言模型优化知识蒸馏方法+2
2024-10-30
AppAgent 腾讯实验室
appagent 腾讯实验室多模态代理框架智能手机应用操作+2
2024-10-30
mobile-agent v2 阿里 android app agents
mobile agent v2多智能体架构移动设备操作助手+2
2024-10-30
mobile-agent 阿里 android app agents
mobile agent技术android app自动化多模态大模型应用+2
2024-10-29
lightweight neural app control 华为 AI-Agent
lightweight neural app control华为 ai-agent多模态应用控制架构+2
2024-10-24
Class-RAG 论文点
class-rag论文解析内容审核分类器retrieval-augmented generation+2
2024-10-16
DistilBERT 论文点
distilbert 模型压缩知识蒸馏 nlpbert 轻量化+2
2024-10-16
ALBERT 论文点
albert论文解析albert模型优化分解嵌入参数化+4
2024-10-16
RoBERTa 论文点
roberta 论文解析nlp 预训练模型bert 优化技术+2
2024-10-16
DINOv2 论文点
dinov2论文解析自监督视觉学习图像特征提取技术+2
2024-10-16
SimSIAM 论文点
simsiam论文解读simsiam创新点simsiam无监督学习+2
2024-10-16
BYOL 论文点
byol 自监督学习byol 架构详解自蒸馏 无负样本+2
2024-10-16
NNCLR 论文点
nnclr论文解读对比学习方法自监督学习+2
2024-10-16
SimCLR 论文中文翻译
simclr论文解析对比学习框架自监督视觉表征+2
2024-09-24
深度学习,Moshi:实时语音到语音生成 Transformer 开源模型
翻译论文
2024-09-24
Qwen2.5-Coder Technical Report
翻译论文
2024-09-18
MemoRAG:利用长期记忆来增强LLM的能力
MemoRAG
2024-09-18
Agent Workflow Memory:智能体工作流
智能体工作流