编辑
2024-10-25
深度学习ban
00

该文章已加密,点击 阅读全文 并输入密码后方可查看。

编辑
2024-10-24
深度学习ban
00

该文章已加密,点击 阅读全文 并输入密码后方可查看。

编辑
2024-10-24
DL论文
00

https://arxiv.org/html/2410.14881v1

强大的内容审核分类器对生成式AI系统的安全至关重要。内容审核,或称为安全分类,一直以来都充满模糊性:安全与不安全输入之间的差异通常非常微妙,使得分类器(甚至是人类)在缺乏进一步上下文或解释的情况下,很难正确地区分违规样本和正常样本。此外,随着这些技术在各种应用和用户群体中不断部署,通过持续的模型微调来扩展风险发现和缓解的难度与成本也越来越大。

为应对这些挑战,我们提出了一种基于Retrieval-Augmented Generation (RAG)的分类方法,即Class-RAG。Class-RAG通过访问可动态更新的检索库,扩展了其基础大语言模型(LLM)的能力,从而实现了语义热修复(semantic hotfixing),以便灵活、即时地缓解风险。与传统的微调模型相比,Class-RAG在决策过程中表现出更大的灵活性和透明性。实证研究表明,Class-RAG在分类任务上表现更为出色,且对对抗性攻击更加鲁棒。此外,我们的研究结果表明,Class-RAG的性能随检索库规模的增长而提升,这意味着增加检索库的规模是一种可行且低成本的提升内容审核能力的方式。

编辑
2024-10-22
深度学习ban
00

该文章已加密,点击 阅读全文 并输入密码后方可查看。

编辑
2024-10-22
深度学习ban
00

该文章已加密,点击 阅读全文 并输入密码后方可查看。

编辑
2024-10-22
深度学习ban
00

该文章已加密,点击 阅读全文 并输入密码后方可查看。

编辑
2024-10-21
售卖作品
00

【一定要看附件的内容!】 广 西 大 学 电气类专业动手集中实践课程征集选题 课程名称:高级程序语言课程设计
项目名称:众创空间实验室设备与耗材管理系统(题目1)

编辑
2024-10-21
深度学习
00

视觉算法在现代相机中的应用与发展

随着智能手机和数码相机的飞速发展,视觉算法在提升摄影体验和图像质量方面发挥了至关重要的作用。从图像超分辨率到人像美颜,再到复杂的场景识别和防抖系统,视觉算法的进步不断推动着相机技术的革新。本文将详细探讨视觉算法在相机中的多种应用,并分析主要厂商在这一领域的团队架构与最新成果。

编辑
2024-10-21
深度学习
00

参考这篇:https://zhuanlan.zhihu.com/p/678590849

https://polaxiong.com/wiki/hou-qi-shu-yu/rui-hua.html

1. 相机成像的流程

1.1 完整的成像系统

一个完整的成像系统主要包括几个部分:

  • 镜头负责成像聚焦。
  • 滤光片根据相机类型选择,彩色相机用可见光带通滤光片,夜视相机用IR-CUT。
  • CMOS图像传感器将光信号转为数字信号。
  • ISP通过数字图像处理算法处理传感器采集的原始图像,编码器则负责压缩和输出图像。
编辑
2024-10-21
深度学习
00

主流的CMOS和CCD传感器通常输出Bayer马赛克格式的RAW数据,这种格式的图像数据无法直接被用户观看,必须经过转换才能变为常见的RGB或YUV格式,从而被主流图像处理软件所支持。在相机产品中,通常还需将RGB或YUV格式的图像进一步压缩为JPEG格式,以便于存储。整个图像处理过程被统称为图像信号处理(Image Signal Processing,ISP),其中广义的ISP不仅涵盖JPEG和H.264/265等压缩处理,狭义的ISP则仅指从RAW格式到RGB或YUV格式的转换。

由于图像信号处理需要处理海量数据,并且对实时性要求非常高,因此ISP通常采用硬件实现。有些图像传感器自身集成了部分ISP功能,用户可以根据需求选择启用或禁用。此外,ISP还可能作为独立芯片或SoC IP模块,能够从供应商处采购。下图展示了一个典型的相机系统功能框图,主要包括图像传感器(Image Sensor)、ISP硬件(ISP Hardware)、ISP实时处理模块(ISP Real-Time Loop)等核心组件,以及PC端的ISP调试工具(PC Image Tuning Tools)、用户程序(User Application)、配置文件等。有些ISP硬件还集成了计算机视觉(CV)算法功能,例如镜头畸变校正(Distortion Correction)等。

编辑
2024-10-21
深度学习
00

1. 光线捕获与光学系统

1.1 镜头(Lens)

  • 组成:由多个光学镜片组成,通常包括广角、长焦和超广角镜头。
  • 功能:聚焦光线,形成清晰的影像。
  • 参数
    • 焦距:决定视角大小。
    • 光圈(Aperture):控制进入光线的数量,影响景深和曝光。
编辑
2024-10-21
深度学习
00

安装vllm并部署Qwen2VL API 重新打包CUDA12.1支持镜像

在之前的文章中

https://www.dong-blog.fun/post/1779

使用了官方提供的CUDA 12.4镜像。为了支持CUDA 12.1,我重新打包了一个镜像。以下是具体步骤。

1. 使用基础镜像并运行容器

首先,基于 pytorch/pytorch:2.4.0-cuda12.1-cudnn9-devel 镜像启动容器:

bash
展开代码
docker run --rm --net host -it --gpus all --shm-size 16g -v /root/xiedong:/root/xiedong pytorch/pytorch:2.4.0-cuda12.1-cudnn9-devel bash
编辑
2024-10-21
深度学习
00

为了让镜像在cuda12.1.0编译,只能自己build一个镜像了。官方的现在的cuda12.4镜像。如果自己显卡的驱动不高,是无法支持cuda12.4的。

编辑
2024-10-18
深度学习
00

使用 vllm 部署 Qwen2VL API

参考资料:

官方文档:vllm 部署指南

编辑
2024-10-18
课程学习
00

image.png

page_1 前言 1998年,国家教育部在其颁布的《普通高等学校本科专业目录和专业介绍》中,在每个学科专业的毕业生应获得的几个方面的知识和能力的陈述中,都明确提出了这样一项要求:掌握文献检索、资料查询的基本方法,具有初步的科学研究能力和一定的实际工作能力。本教材即是针对我校各个学科的专业设置及学生研究能力的培养,结合我校图书馆的馆藏文献资源及因特网信息资源情况,为选修文献检索课的本科生或研究生而编写。本教材除了第三章2节,第四章2节和第五章3节由林葆编写,第三章4节“二、搜索引擎检索”由韩春华编写,第六章1节由庞蓓编写外,其余章节均由黄日昆编写,全书也由黄日昆统稿。 限于水平,本教材定有误漏,敬请使用者批评指正,以便今后修改完善。 编者 2014年3月

编辑
2024-10-18
课程学习
00

该文章已加密,点击 阅读全文 并输入密码后方可查看。

编辑
2024-10-17
深度学习ban
00

该文章已加密,点击 阅读全文 并输入密码后方可查看。

编辑
2024-10-17
深度学习ban
00

该文章已加密,点击 阅读全文 并输入密码后方可查看。

编辑
2024-10-16
DL论文
00

https://arxiv.org/abs/1910.01108

深度解析 DistilBERT:更小、更快、更便宜的 BERT 模型

近年来,预训练的大规模语言模型在自然语言处理(NLP)领域掀起了一场革命。尤其是 BERT(Bidirectional Encoder Representations from Transformers)模型,通过在多种下游任务中实现卓越的性能,成为了 NLP 领域的基石。然而,BERT 的庞大体量和高昂的计算成本使得在资源受限的环境中部署变得困难。为了解决这一问题,Hugging Face 的研究团队提出了 DistilBERT,这是一种经过蒸馏的 BERT 模型,具有更小的体积和更快的推理速度,同时在性能上几乎没有损失。

本文将深入探讨 DistilBERT 的核心思想、实现方法以及在实际应用中的表现。

编辑
2024-10-16
DL论文
00

https://arxiv.org/abs/1909.11942

深入解析ALBERT:轻量级的BERT模型

近年来,预训练语言模型在自然语言处理(NLP)领域取得了巨大的成功,其中BERT(Bidirectional Encoder Representations from Transformers)模型尤为突出。然而,随着模型规模的扩大,训练和部署大型模型面临着计算资源和效率的挑战。为了解决这些问题,谷歌研究团队提出了ALBERT(A Lite BERT),一种更高效的BERT变体。本文将深入解析ALBERT的核心思想、技术创新和实验结果。