Sitemap

A list of all the posts and pages found on the site. For you robots out there is an XML version available for digesting as well.

Pages

Posts

有意思的损失函数:一文详细解释Yolo中Objectness的重要性

1 minute read

Published:

损失函数对不同的框进行不同的处理,最佳框与所有其他框之间的区分机制是 YOLO 损失的核心。使用单独的对象置信度损失 objectness 来处理分数确实比将类概率 confidence 视为分数表现得更好,在SSD目标检测中考虑类概率作为置信度分数其效果要明显差于带置信度的Yolo模型。

人工智能数据集可视化统计分析工具:快速了解你的数据集

less than 1 minute read

Published:

Lightly Insights:可以轻松获取关于机器学习数据集基本洞察的工具,可以可视化图像数据集的基本统计信息,仅需提供一个包含图像和对象检测标签的文件夹,它会生成一个包含指标和图表的静态 HTML 网页。

视觉基准大模型:基于分割一切SAM模型的微调

less than 1 minute read

Published:

Meta 的两个大型模型在当前 AI 开源界处于领先地位:LLM 的 LLaMA 和 CV 的 SAM。其中Segment Anything Model 是一个基于 Transformer(ViT 主干)的视觉分割基础模型。它可以通过零样本概括自动分割任何图像。另外模型还融入了Prompt:它们可以是要分割的区域上的点、要分割的对象周围的边界框或有关应分割的内容的文本提示。该模型由 3 个组件组成:图像编码器、提示编码器和掩模解码器。

模型部署系列:TensorRT优化原理及模型转换的三种方式

3 minute read

Published:

  • TensorRT 是可以在 NVIDIA 各种 GPU 硬件平台下运行的一个 C++推理框架。我们利用 Pytorch、TF 或者其他框架训练好的模型,可以转化为 TensorRT 的格式,然后利用 TensorRT 推理引擎去运行我们这个模型,从而提升这个模型在英伟达 GPU 上运行的速度。速度提升的比例是比较可观的。

portfolio

publications

talks

teaching

通关计算机视觉检测任务:百道常见面试题深度解析

Detection, Anchor-Free, Anchor-Base, 2023

本博客面向深度学习算法中常见的视觉检测任务,甄选百道常见面试题来进行深度解析,Mark.AI希望通过这些题目的整理和解析,能够为求职者提供一个系统、全面的面试准备资源,帮助你们在面试中表现出色,取得成功。该博客持续更新真实面试题,关注不迷路。