2025-06-03
深度学习ban
00

该文章已加密,点击 阅读全文 并输入密码后方可查看。

2025-06-03
深度学习
00

5种Agent模式


一、反思模式(Reflection Pattern):闭环优化的认知迭代

  • 工作流程
    用户输入 → LLM生成初版响应 → 用户反馈 → LLM反思优化 → 迭代至满意 → 返回终版

2025-06-03
深度学习
00

Fooocus Outpaint 完整处理流程

1. Canvas Expansion & Mask Creation 画布扩展和遮罩创建

12:15:modules/async_worker.py
展开代码
def apply_outpaint(async_task, inpaint_image, inpaint_mask): if len(async_task.outpaint_selections) > 0: H, W, C = inpaint_image.shape if 'top' in async_task.outpaint_selections: inpaint_image = np.pad(inpaint_image, [[int(H * 0.3), 0], [0, 0], [0, 0]], mode='edge') inpaint_mask = np.pad(inpaint_mask, [[int(H * 0.3), 0], [0, 0]], mode='constant', constant_values=255)
  • 根据用户选择的方向(top/bottom/left/right)扩展画布30%
  • 使用edge模式复制边缘像素填充新区域
  • 新区域的mask值设为255(完全需要重绘)
2025-06-03
深度学习ban
00

该文章已加密,点击 阅读全文 并输入密码后方可查看。

2025-06-03
深度学习ban
00

该文章已加密,点击 阅读全文 并输入密码后方可查看。

2025-06-03
深度学习
00

匈牙利算法是做什么的?通俗解释

匈牙利算法(Hungarian Algorithm)是一种用来解决**"最佳分配问题"的数学方法。它的核心任务是:"如何用最低成本,把N个任务分配给N个人,让总成本最小?"**(或者反过来,让收益最大)。

2025-06-02
深度学习
00

的问题:

1. OpenPose的输入和输出形状

输入形状:

cpp
展开代码
// 从 src/openpose/net/netCaffe.cpp:218 可以看到 if (inputData.getNumberDimensions() != 4 || inputData.getSize(1) != 3) error("The Array inputData must have 4 dimensions: [batch size, 3 (RGB), height, width].");

输入张量形状: [batch_size, 3, height, width]

  • batch_size: 批次大小,通常为1
  • 3: RGB三通道
  • height, width: 图像的高度和宽度
2025-06-02
深度学习
00

CDP:共识驱动传播人脸聚类方法

摘要

CDP(Consensus-Driven Propagation)是一种高效的大规模无标签人脸聚类方法。该方法通过投票机制和图传播算法,实现对人脸特征的快速准确聚类。CDP具有线性时间复杂度,能够处理大规模数据集,并在保持高精度的同时提供出色的聚类性能。

2025-06-02
深度学习
00

1. 人脸检测方法数量和类型

InsightFace主要包含3种核心人脸检测方法:

1.1 RetinaFace (CVPR 2020)

  • 架构: 基于FPN的单阶段检测器
  • 特点: 同时预测人脸边界框和5个关键点
  • 骨干网络: ResNet50/ResNet152/MobileNet0.25
  • 性能: WiderFace验证集 Easy 96.5, Medium 95.6, Hard 90.4
2025-06-02
深度学习
00

U-Net 2015 :编码器-解码器结构、跳跃连接。

HRNet 2019 : 设计用于需要高分辨率特征的任务.

  • 高分辨率主干( 网络从头到尾都维持一个高分辨率的特征流,而不是像U-Net那样先降维再升维。)
  • 多尺度特征融合
    • 不同分辨率的特征流之间通过上采样和下采样操作进行交互,实现信息的跨尺度传递。

image.png