2025-10-24
深度学习
00

部署:

bash
展开代码
# 使用vLLM启动 python -m vllm.entrypoints.openai.api_server \ --model /mnt/jfs6/model/UI-TARS-72B-DPO \ --served-model-name ui-tars \ --host 0.0.0.0 \ --port 8000 \ --trust-remote-code \ --max-model-len 8192 \ --gpu-memory-utilization 0.9 \ --tensor-parallel-size 8
2025-10-24
深度学习
00

crawl4ai

bash
展开代码
docker run -d -p 9045:11235 --name crawl4ai-local --shm-size=1g unclecode/crawl4ai:latest

使用:

bash
展开代码
"crawl4ai": { "url": "http://101.126.150.28:9045/mcp/sse", "description": "Crawl4AI网页爬取和处理服务 - 支持网页爬取、截图、PDF生成、JavaScript执行等" }
2025-10-24
深度学习
00

MCP 四种服务传输类型详解:STDIO、SSE、Streamable HTTP 与 InMemory

引言

Model Context Protocol(MCP)是 Anthropic 推出的开放标准协议,旨在标准化 AI 应用与外部工具、数据源和系统之间的连接方式。就像 USB 标准统一了计算机外设接口一样,MCP 试图解决 AI 集成中的"M×N 问题"——将 M 个不同的 AI 应用与 N 个不同工具的集成从 M×N 个独立实现简化为 M+N 个标准化实现。

在 MCP 架构中,传输层(Transport)是实现客户端与服务器通信的基础。本文将深入探讨 MCP 的四种主要传输类型及其应用场景。

2025-10-23
Linux运维
00

确保所有 tmux 进程已终止:

bash
展开代码
sudo pkill -f tmux
2025-10-23
深度学习
00

https://forum.cursor.com/t/ctrl-c-will-not-copy/70657

edit keybindings.json to add:

mkdir -p ~/.cursor/User

bash
展开代码
[ { "key": "ctrl+c", "command": "workbench.action.terminal.copySelection", "when": "terminalFocus && terminalProcessSupported && terminalTextSelected" }, { "key": "ctrl+shift+c", "command": "workbench.action.terminal.sendSequence", "args": { "text": "\\u0003" }, "when": "terminalFocus" } ]
2025-10-21
深度学习
00

https://hf-mirror.com/

bash
展开代码
git lfs pull
2025-10-21
深度学习
00

访问 Node.js 官方网站 (https://nodejs.org) 。通常,官网会直接推荐最新的长期支持 (LTS) 版本,这个版本更稳定,非常适合大多数用户。直接点击页面上的推荐版本进行下载即可。

✅ 验证安装

分别输入以下两条命令并执行:

  • node -v:此命令会显示已安装的 Node.js 的版本号。
  • npm -v:此命令会显示 npm(Node Package Manager)的版本号,它通常随 Node.js 一同自动安装。 如果两个命令都返回了版本号(例如 v18.17.09.6.7),就说明安装成功了。
2025-10-21
深度学习
00
2025-10-21
深度学习
00

前Manus产品经理对Agent的思考: https://mp.weixin.qq.com/s/tewBKHgbyrjxUjAOmkXI7A

总结其核心内容:

核心观点

Agent的本质:AI Agent的强大不在于模型本身的智力提升,而在于我们为其设计的"认知流程"。这套流程让AI从"一次性生成答案"进化为"动态解决问题"。

五个成长阶段(用学霸比喻)

  1. 原生天才(基础LLM):直接输出答案,但无法验证可靠性
  2. 思考者(CoT-思维链):将复杂任务分解为线性推理步骤
  3. 细心人(Reflexion-自我反思):能复盘错误并迭代优化
  4. 战略家(Planning-规划):先制定计划再执行
  5. 学者(ReAct-工具使用):通过"思考→行动→观察"循环与外界交互

流程的三重价值

  1. 用"结构"对抗"混沌":通过规划和思维链为AI建立逻辑脚手架
  2. 用"迭代"对抗"遗忘":通过反思机制压缩和提炼关键信息
  3. 用"交互"对抗"虚无":通过工具调用获取真实世界的反馈

理论基础

  • 控制论:闭环系统通过反馈机制不断逼近目标
  • 信息论:通过获取信息降低不确定性(熵减)

未来方向

文章呼吁开发者从"提示词工程师"转变为"Agent流程架构师",关注:

  • 智能工作流编排
  • 多Agent协同(规约驱动)
  • 动态代码生成能力
  • 性能优化(并行化、模型特化、高效记忆架构)

关键洞察:Agent与Chatbot的区别不在于"调用几次",而在于是否具备目标导向的、可自我修正的动态流程

2025-10-21
DL论文
00

https://huggingface.co/deepseek-ai/DeepSeek-OCR

DeepSeek-OCR:光学压缩技术开辟文本处理新范式

引言

在大语言模型(LLM)处理长文本时面临的计算挑战日益凸显,DeepSeek-AI团队提出了一个创新性的解决方案——DeepSeek-OCR。这项研究探索了通过视觉模态实现文本信息高效压缩的可行性,为解决长上下文处理问题开辟了全新的技术路径。