Kaifan's Blog

发表于2025-12-30

感谢大佬Coding茶水间的博客SAM3模型来了，手把手带你运行SAM3模型代码，SAM3模型初探！的指导 SAM3是2025年新发布的大模型，对配置要求较高，很多教程都提到了CUDA ≥ 12.6，但本人用组内的3090服务器（CUDA118）亲测可用，以下是本人的部署过程（踩坑指南），本人比较愚笨，只会用笨办法。以下教程适合Linux，Win系统指路Coding茶水间大佬的文章。 1、SAM3源码与权重下载 SAM3的源码可在gitbub上下载，权重需要在Hugface上单独申请，但据说不太容易申请到，国内Modelscope上已经有大佬上传了权重，权重直接放在sam3路径下就可以。导入权重后需要按照第3章修改下配置。 2、环境搭建环境搭建基本照抄官方教程创建新的 Conda 环境： 123conda create -n sam3 python=3.12conda deactivateconda activate sam3 安装支持 CUDA 的...

低光增强数据集

发表于2025-12-28

本文汇总了目前主流的配对的低光图像数据集。 1 LOLV数据集 LOL数据集包含LOL-v1和LOL-v2两个版本，其中LOL-v2进一步划分为LOL-v2-real（真实世界数据）和LOL-v2-sync（合成数据）。具体而言，LOL-v1包含500对从真实自然场景中采集的低光/正常光图像，其中485对用于训练，15对用于测试。LOL-v2-real包含698对训练图像和100对测试图像；LOL-v2-sync则包括900对训练图像和100对测试图像。 1.1 LOLv1数据集下载地址来源文献：Deep Retinex Decomposition for Low-Light Enhancement 1.2 LOLv2数据集下载地址来源文献：Sparse gradient regularized deep retinex network for robust low-light image enhancement Training Set: 689 images Testing Set: 100 images 2 SID数据集下载地址 Github详情页...

低光增强损失函数

发表于2025-12-28

本文记载了在Low Light Image Enhancement （LLIE）任务中常见的损失函数，并提供了相应的代码。其中的一些损失函数在其他Low Level任务中也可以适用。 L1损失 L1损失广泛应用在图像的各个任务中，L1损失（也称 Mean Absolute Error, MAE / 平均绝对误差）是深度学习和统计回归中常见的一种损失函数。它通过计算预测值与真实值之间的绝对差值来衡量误差： 123456789101112import torch.nn as nnLoss = nn.L1Loss() # 或者class L1_loss(nn.Module): def __init__(self): super().__init__() self.loss = nn.L1Loss() def forward(self, light_map, normal_img): loss = self.loss(light_map, normal_img) return...

Fasterrcnn总结

发表于2025-04-16

FaterRCNN代码学习总结1 1.项目结构 backbone为FaterRCNN主干网络部分的代码，包括其权重，此开源项目提供了VGG和resnet50两种，并提供了对应的权重文件，代码的作者认为backbone部分已经在coco数据集上训练完善了，因此在新的训练中可以直接调用coco数据集的权重文件作为权重初始化。 data为自己创建的COCO数据格式的月球陨石坑数据集 network_files为除backbone以外的结构部分，如roi_head、rpn_function和boxes、transform等对预测框和图像进行处理转换的脚本。 save_weights为训练过程每一轮权重的存放目录 train_utils是一个自定义的Python工具模块，主要包含训练过程中常用的辅助函数和工具类 2.train文件 2.1模块导入 [lang:Python] import1234567891011import osimport datetimeimport torchfrom tqdm import tqdm # 进度条显示库import transforms #...

Tmux--让服务器在后台继续干苦力

发表于2025-04-10

Tmux是陈师兄介绍的方法，Tmux是一个终端复用器（terminal multiplexer），属于常用的开发工具，学会了之后可以大大的提高工作效率。作为服务器窗口操作，主要可以用到的命令如下：（PS：本文作为笔者自己的笔记，感谢：https://blog.csdn.net/CSSDCC/article/details/121231906 文章新建窗口 tmux new -s your-session-name 在tmux窗口中，按下ctrl+b d或者输入以下命令，就会将当前session与窗口分离，session转到后台执行 tmux detach 退出session tmux kill-session -t your-session-name 该命令会直接杀死窗口切换窗口： ctrl+b c: 创建一个新窗口（状态栏会显示多个窗口的信息） ctrl+b p: 切换到上一个窗口（按照状态栏的顺序） ctrl+b n: 切换到下一个窗口 ctrl+b w: 从列表中选择窗口（这个最好用）使用快捷键ctrl+b [...

投影方式

发表于2025-04-08

等距圆柱投影等距圆柱投影方式如图所示：等距圆柱投影（Equidistant Cylindrical Projection）是一种简单的地图投影方法，属于圆柱投影的一种。它的特点是保持经线和纬线均为等距的平行直线，形成规则的网格基本特性经纬线形状：经线：等间隔的平行竖直线。纬线：等间隔的平行水平线，与经线垂直。网格呈矩形，类似棋盘。等距性质：沿经线方向：任意两条纬线之间的距离与实际地球表面相同（纬度间隔保持等距）。沿纬线方向：赤道上的比例尺是真实的，但高纬度地区的东西方向会被拉伸（因纬线长度与实际不符）。变形：角度变形：所有纬线和经线的交点处角度保持不变（局部形状在小范围内近似），但整体地图存在显著的角度变形，尤其是高纬度地区。面积变形：高纬度地区的面积会被夸大（例如极地地区显得异常大）。