SAM3部署跑通踩坑记录——用低版本CUDA118跑通SAM3
感谢大佬Coding茶水间的博客SAM3模型来了,手把手带你运行SAM3模型代码,SAM3模型初探!的指导 SAM3是2025年新发布的大模型,对配置要求较高,很多教程都提到了CUDA ≥ 12.6,但本人用组内的3090服务器(CUDA118)亲测可用,以下是本人的部署过程(踩坑指南),本人比较愚笨,只会用笨办法。 以下教程适合Linux,Win系统指路Coding茶水间大佬的文章。 1、SAM3源码与权重下载 SAM3的源码可在gitbub上下载,权重需要在Hugface上单独申请,但据说不太容易申请到,国内Modelscope上已经有大佬上传了权重,权重直接放在sam3路径下就可以。导入权重后需要按照第3章修改下配置。 2、环境搭建 环境搭建基本照抄官方教程 创建新的 Conda 环境: 123conda create -n sam3 python=3.12conda deactivateconda activate sam3 安装支持 CUDA 的...
低光增强数据集
本文汇总了目前主流的配对的低光图像数据集。 1 LOLV数据集 LOL数据集包含LOL-v1和LOL-v2两个版本,其中LOL-v2进一步划分为LOL-v2-real(真实世界数据)和LOL-v2-sync(合成数据)。具体而言,LOL-v1包含500对从真实自然场景中采集的低光/正常光图像,其中485对用于训练,15对用于测试。LOL-v2-real包含698对训练图像和100对测试图像;LOL-v2-sync则包括900对训练图像和100对测试图像。 1.1 LOLv1数据集 下载地址 来源文献:Deep Retinex Decomposition for Low-Light Enhancement 1.2 LOLv2数据集 下载地址 来源文献:Sparse gradient regularized deep retinex network for robust low-light image enhancement Training Set: 689 images Testing Set: 100 images 2 SID数据集 下载地址 Github详情页...
低光增强损失函数
本文记载了在Low Light Image Enhancement (LLIE) 任务中常见的损失函数,并提供了相应的代码。其中的一些损失函数在其他Low Level任务中也可以适用。 L1损失 L1损失广泛应用在图像的各个任务中,L1损失(也称 Mean Absolute Error, MAE / 平均绝对误差)是深度学习和统计回归中常见的一种损失函数。它通过计算预测值与真实值之间的 绝对差值 来衡量误差: 123456789101112import torch.nn as nnLoss = nn.L1Loss() # 或者class L1_loss(nn.Module): def __init__(self): super().__init__() self.loss = nn.L1Loss() def forward(self, light_map, normal_img): loss = self.loss(light_map, normal_img) return...
Fasterrcnn总结
FaterRCNN代码学习总结1 1.项目结构 backbone为FaterRCNN主干网络部分的代码,包括其权重,此开源项目提供了VGG和resnet50两种,并提供了对应的权重文件,代码的作者认为backbone部分已经在coco数据集上训练完善了,因此在新的训练中可以直接调用coco数据集的权重文件作为权重初始化。 data为自己创建的COCO数据格式的月球陨石坑数据集 network_files为除backbone以外的结构部分,如roi_head、rpn_function和boxes、transform等对预测框和图像进行处理转换的脚本。 save_weights为训练过程每一轮权重的存放目录 train_utils是一个自定义的Python工具模块,主要包含训练过程中常用的辅助函数和工具类 2.train文件 2.1模块导入 [lang:Python] import1234567891011import osimport datetimeimport torchfrom tqdm import tqdm # 进度条显示库import transforms #...
Tmux--让服务器在后台继续干苦力
Tmux是陈师兄介绍的方法,Tmux是一个终端复用器(terminal multiplexer),属于常用的开发工具,学会了之后可以大大的提高工作效率。 作为服务器窗口操作,主要可以用到的命令如下:(PS:本文作为笔者自己的笔记,感谢:https://blog.csdn.net/CSSDCC/article/details/121231906 文章 新建窗口 tmux new -s your-session-name 在tmux窗口中,按下ctrl+b d或者输入以下命令,就会将当前session与窗口分离,session转到后台执行 tmux detach 退出session tmux kill-session -t your-session-name 该命令会直接杀死窗口 切换窗口: ctrl+b c: 创建一个新窗口(状态栏会显示多个窗口的信息) ctrl+b p: 切换到上一个窗口(按照状态栏的顺序) ctrl+b n: 切换到下一个窗口 ctrl+b w: 从列表中选择窗口(这个最好用) 使用快捷键ctrl+b [...
投影方式
等距圆柱投影 等距圆柱投影方式如图所示: 等距圆柱投影(Equidistant Cylindrical Projection)是一种简单的地图投影方法,属于圆柱投影的一种。它的特点是保持经线和纬线均为等距的平行直线,形成规则的网格 基本特性 经纬线形状: 经线:等间隔的平行竖直线。 纬线:等间隔的平行水平线,与经线垂直。 网格呈矩形,类似棋盘。 等距性质: 沿经线方向:任意两条纬线之间的距离与实际地球表面相同(纬度间隔保持等距)。 沿纬线方向:赤道上的比例尺是真实的,但高纬度地区的东西方向会被拉伸(因纬线长度与实际不符)。 变形: 角度变形:所有纬线和经线的交点处角度保持不变(局部形状在小范围内近似),但整体地图存在显著的角度变形,尤其是高纬度地区。 面积变形:高纬度地区的面积会被夸大(例如极地地区显得异常大)。
