- 博客(192)
- 资源 (8)
- 收藏
- 关注
原创 Ollama: 大模型本地部署&远程调用&Python接口
Ollama 是一个开源的大型语言模型(LLM)服务工具,旨在简化在本地机器上部署和运行大型语言模型的过程。本地部署:Ollama 允许用户在本地机器上部署和运行大型语言模型,无需依赖外部服务器或云服务。这使得用户可以在私有环境中使用强大的语言模型功能,保护数据隐私和安全性.简化部署过程:通过提供一键安装和配置的脚本,Ollama 大幅简化了在 Docker 容器中部署大型语言模型的过程。用户只需运行简单的命令,即可快速搭建起模型运行环境,无需手动配置复杂的依赖和参数.多模型支持。
2025-02-18 13:33:11
969
原创 音频入门(一):音频基础知识与分类的基本流程
音频信号是声音波形的电学表示,它可以捕捉声音的频率、幅度和时间特性。模拟音频信号模拟音频信号是连续变化的电信号,它模拟了原始声音波形的物理特性。它可以通过麦克风捕获,并通过扬声器、耳机或放大器进行播放。模拟信号可以被录制在磁带、黑胶唱片等介质上。数字音频信号数字音频信号是通过将模拟信号转换为一系列数字值来表示的,这个过程称为模数转换(ADC)。数字音频信号通常以文件形式存储,如MP3、WAV、AAC等格式。数字音频可以方便地进行编辑、处理和传输,且不受模拟信号的退化问题影响。采样率。
2025-01-21 15:17:27
1633
原创 【PyQT5】F11按键设置/退出全屏模式
全屏模式允许应用程序开发者创建自定义的布局和界面元素,以更好地适应屏幕大小和分辨率。这有助于提供一致的用户体验,无论用户使用的是哪种设备或屏幕尺寸。
2024-11-26 10:18:47
1135
原创 【kohya_ss】从0开始,训练一个LoRA模型
本文提供了从环境配置到LoRA训练再到最后的效果测试的整个流程,供想要玩玩LoRA的同学参考。
2024-10-21 08:50:53
2450
原创 基于socket实现客户端与服务器之间TCP通信
我们在算法部署时,通常需要进行算法端与其他服务端的通信,要么接受指令、要么是需要上传算法结果;除了我们常用的gRPC、HTTP、MQ等方式,还可以利用TCP来实现可靠通信;本次我们利用socket来展示如何进行两端的TCP通信。
2024-10-14 08:30:00
1119
原创 Python Opencv: 基于颜色提取的印章分割
利用Python实现了一个图像处理功能,即批量提取图像中的印章区域;使用了颜色聚类的方法来提取颜色。
2024-09-09 15:45:20
2261
原创 mmsegmentation: 安装并使用自定义数据集进行训练
本文从实际的案例出发,介绍了如何在mmsegmentation使用自定义数据集和添加自定义模块,并介绍了安装过程的一些坑;供大家学习交流。
2024-08-13 14:44:20
2989
13
原创 C++: 如何把源码编译成SDK提供第三方使用
在我们开发过程中,经常会遇到提供SDK的情况,对于C++语言,是可以方便地将源码封装成静态库或者动态库然后打包提供给第三方使用的。这样,一方面可以保护源码,另一方面也简化了对方的使用过程。
2024-08-05 08:35:46
2072
原创 PyQT: 开发一款ROI绘制小程序
基于Python和PyQt5框架开发了一款桌面应用程序,允许用户加载图片或视频流,并在这些媒体上绘制感兴趣的区域
2024-07-04 13:45:36
1442
1
原创 Python tkinter: 开发一个目标检测GUI小程序
程序提供了一个用户友好的界面,允许用户选择图片或文件夹,使用行人检测模型进行处理,并在GUI中显示检测结果。用户可以通过点击画布上的检测结果来获取更多信息,并使用键盘快捷键来浏览不同的图片。
2024-07-01 13:46:14
1432
原创 SQLite:一个极简使用教程
SQLite是一个轻量级的、文件系统基础的数据库,它被设计为配置简单、易于部署。SQLite数据库存储在一个单一的磁盘文件中,这意味着数据库的创建和维护都非常简单。
2024-06-25 08:51:31
5713
原创 SCNet: 全1*1卷积的轻量图像超分辨率
深度学习模型尤其是大卷积核(3*3或更大)在单图超分辨率(single image superresolution,SISR)上取得显著进展。然而,庞大的计算量阻碍其在实时、资源受限环境中的应用。相反,1*1卷积在计算效率上能力可观,但却在局部空间表示聚合方面能力不足,而这恰恰却是SISR模型所需要的基本能力。
2024-06-05 09:34:44
1443
原创 RKNN:yolov8模型转换与板端推理流程
记录了“yolov8的torch模型转onnx再转rknn,并在瑞芯微RK3588上进行推理验证”的过程。
2024-04-27 14:35:54
7158
33
原创 RepViT:当MobileNet遇到ViT
近期,在资源受限的的移动设备上,轻量ViTs表现出了比CNNs更好的性能和更低的延迟。研究人员发现了轻量级vit和轻量级cnn之间的许多结构联系。然而,尚未充分检查它们之间的块结构、宏观和微观设计的显着架构差异。在这项研究中,我们从 ViT 的角度重新审视轻量级 CNN 的有效设计,并强调它们对移动设备的前景。具体来说,我们通过集成轻量级 ViT 的有效架构设计,逐步增强标准轻量级 CNN(即 MobileNetV3)的移动友好性。这最终得到了一系列新的纯轻量级cnn,即RepViT。
2024-04-24 10:00:04
1604
原创 Minio: 文件类型数据存储
另一种方式是,将这些文件以对象的方式存储到云服务器上,这样既没有丢失风险,也不必担心本地磁盘被撑爆,同时也方便给他人分享数据。我们这里提供了一种客户端实现,可以将文件或者对象上传到指定的服务器路径上,并根据指定的“bucket”进行查询与自动创建。在这里,我们利用了一个叫做Minio的对象存储方式,它可以提供安全、可靠、边界的存储及分享方式。:param bucket_names: 桶名称,用于存放数据的根目录。支持两种上传方式:文件形式、对象形式。:param secret_key: 密码。
2024-04-07 11:39:32
1682
原创 NWPU-MOC:密集多类别目标计数,方法和benchmark
目标计数是CV领域的一个热门任务,其目的在于估计给定图像中的目标个数。然而,当前大多数方法都是针对单类别的,这对于需要同时对多种类别进行计数的场景来说就不适用了,尤其在航拍图中。为了解决这个问题,本文引入了一个多类别目标计数(MOC)任务,来估计在一个航拍图中不同类别目标(如车、建筑、船等)的个数。考虑到缺乏相关数据集,同时也构造了一个包含了3416个场景、1024*1024分辨率、14个精细标注类别的大型数据集——NWPU-MOC。
2024-03-22 10:06:53
2164
2
原创 FcaNet:频率通道注意力,进阶版SE
注意力机制,尤其是通道注意力,在CV领域取得了巨大成功。大部分研究都集中在如何设计更高效的通道注意力机制,却忽略了一个基本问题,也即:他们都是使用全局平均池化(GAP)来作为预处理方法。尽管GAP十分简单高效,但他的捕获的信息也确实不足。对注意力进行重新思考,并从数学上证明了GAP就是频域特征分解的一个特例。基于此,作者将通道注意力机制的预处理泛化到了频域,并基于。2)DCT可以看做输入的加权和,上述DCT公式中的cos部分可以当做权重。在CNN中常用通道注意力来对不同通道的特征进行加权。
2024-03-22 10:05:07
4407
1
原创 YOLO-World初体验:Ultralytics版本,可直接上手,离线运行
YOLOv8官方新增了对YOLO-World的支持,本文利用其提供的模型及接口进行了体验。
2024-02-20 10:17:11
18229
43
原创 RTMO: 超越YOLO-pose的高性能、单阶段、多人姿态估计
提出的RTMO框架如下图所示:网络框架描述如下:输入图像经过backbone(CSPDarknet)后,最后三层feature map经过Hybrid Encoder得到16、32倍下采样的空间feature mapP4、P5,送入Heads;每个Head生成一个得分feature、一个坐标姿态feature,其中坐标姿态feature用于预测bbox、关键点坐标、关键点可见性。****强行插入一段*****:关于坐标分类,没做过的小伙伴可能有点懵,我们可以从SimCC这篇文章中的方法一窥其貌。
2023-12-14 17:14:20
4330
原创 Triton算法服务部署:初识与试用【Hello world】
介绍了Triton,并结合官方文档给出了一个Hello World级别的使用示例。
2023-12-13 09:47:45
1596
原创 Flask基本用法:一个HelloWorld,搭建服务、发起请求
Flask是一个轻量的web服务框架,我们可以利用它快速搭建一个服务,对外提供接口,其他人可以轻松调用我们的服务。这对算法工程师来说比较关键,我们通常不擅长搞开发,这种框架十分适合将算法封装成服务的形式提供给其他人使用。更多介绍可从搜索引擎找到,这里不过多介绍。我们直接给出一个使用示例,相信大家看了后能快速掌握Flask的基本用法。
2023-12-13 09:47:20
1903
原创 gRPC基本用法:以人脸识别为例,搭建一个简单的gRPC服务
内含一个完整的人脸识别gRPC服务的github代码;文章以人脸识别为例,提供了一个gRPC的基本用法
2023-12-11 08:38:54
1626
原创 基于点之间距离的多目标跟踪
目标跟踪是计算机视觉领域一种常用的算法,用于将前后帧中的同一个目标关联起来,从而可以针对某一个特定目标进行分析,如对状态进行投票平滑获取更为稳健的结果。然而,目前流行的跟踪算法大多是基于检测的bbox之间的IOU来匹配的,这对于某些小目标或者点的检测,IOU通常不是一个好的选择,因为目标太小,很容易使得相邻两帧之间的IOU为0。为了解决这个问题,本文提出了一种基于点之间距离的跟踪方法:将目标建模为一个点,通过计算前后帧点之间的距离,利用匈牙利匹配来进行跟踪。
2023-11-22 11:15:42
778
原创 MODNet:基于目标分解的实时trimap-free肖像抠图
本文提出了一种轻量级、trimap-free的目标分解网络(MODNet),关键思想是通过显式约束同时优化一系列子目标。此外,还提出了一个高效的 空洞空间金字塔池 (e-ASPP) 模块来融合多尺度特征以进行语义估计,一种自监督子目标一致性(SOC)策略,使MODNet适应真实世界的数据,以解决无trimap方法常见的域转移问题
2023-11-08 13:42:08
1494
原创 Deep Image Matting:深度学习Matting开山之作
在此之前的Matting方法要么是用传统方法,要么是传统+深度学习的组合,他们都难以达到理想效果。因此,本文提出了一个利用trimap来作为辅助输入,并完全使用深度学习方法来进行Matting的方法,这开创了trimap-based Deep Learning Matting的先河。
2023-11-03 14:19:38
506
原创 PP-Matting:trimap free的高精度自然图像抠图
介绍了PP-Matting,一种trimap-free的高精度自然图像抠图方法,通过SCB和HRDB分支分别获取语义上下文和细节特征,从而获取高精度的Matting结果。
2023-11-03 10:57:42
1766
15K自行收集的抽烟打电话的数据集,YOLO格式可直接使用,支持售后
2024-10-10
3K自行收集的垃圾桶检测数据集
2024-10-10
Traffic Camera Object Detection数据集
2024-10-10
DAWN(Detection in Adverse Weather Nature)数据集
2024-10-10
lite.ai.toolkit与使用说明
2024-10-10
双目相机标定程序,可根据拍摄的标定板图像,进行相机参数估计
2024-10-10
Python相机标定程序,适用于单目相机
2024-10-10
百货商店商品管理系统-Python程序设计
2024-10-10
学生成绩管理系统-C++程序设计,可实现成绩的增删改查、过滤等操作
2024-10-10
通讯录-C++程序设计,可实现基本的联系人增删改查等功能
2024-10-10
多标签分类标注器-windows版
2024-10-10
多标签分类标注器-linux版
2024-10-10
ROI绘制小工具-win-x86-64
2024-10-10
ROI绘制小程序-linux版
2024-10-10
Linux版文件加密解密小工具
2024-06-26
【windows版】文件加密解密小工具
2024-06-26
抽烟打电话目标检测数据集
2024-06-26
cifar10_cifar100合集.zip
2020-08-14
【全国行政区划对应表】administrative_division_code.sql
2019-06-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人