caoporm国产精品视频免费,国产v片在线播放免费无码,国产v片在线播放免费无码

目標檢測介紹

目標檢測是計算機視覺領域中最基礎且最具挑戰(zhàn)性的任務之一，其包含物體分類和定位。它為實例分割、圖像捕獲、視頻跟蹤等任務提供了強有力的特征分類基礎。

傳統(tǒng)的目標檢測方法包括預處理、區(qū)域提案、特征提取、特征選擇、特征分類和后處理六個階段，大多數(shù)檢測模型關注于物體特征的提取和區(qū)域分類算法的選擇。

Deformable Part?based Model（DPM）算法三次在PASCAL VOC目標檢測競賽上獲得冠軍，是傳統(tǒng)目標檢測方法的巔峰之作. 然而在2008年至2012年期間，目標檢測模型在PASCAL VOC數(shù)據(jù)集上的檢測準確率逐漸達到瓶頸. 傳統(tǒng)方法的弊端也展現(xiàn)出來，主要包括：

算法在區(qū)域提案生成階段產(chǎn)生大量冗余的候選框且正負樣本失衡；

特征提取器如HOG、SIFT等未能充分捕捉圖像的高級語義特征和上下文內(nèi)容；

傳統(tǒng)檢測算法分階段進行，整體缺乏一種全局優(yōu)化策略

目標檢測數(shù)據(jù)集

目前主流的通用目標檢測數(shù)據(jù)集有PASCAL VOC、ImageNet、MS COCO、Open Images和Objects365。

目標檢測評價指標

當前用于評估檢測模型的性能指標主要有幀率每秒（Frames Per Second，F(xiàn)PS）、準確率（accuracy）、精確率（precision）、召回率（recall）、平均精度（Average Precision，AP）、平均精度均值（mean Average Precision，mAP）等。

FPS即每秒識別圖像的數(shù)量，用于評估目標檢測模型的檢測速度；

accuracy是正確預測類別的樣本數(shù)占樣本總數(shù)的比例；

precision是預測正確的正樣本數(shù)占所有預測為正樣本個數(shù)的比例；

recall是預測正確的正樣本數(shù)占所有真實值為正樣本個數(shù)的比例；

PR曲線是對應precision和recall構成的曲線；

AP是對不同召回率點上的精確率進行平均，在PR曲線圖上表現(xiàn)為 PR 曲線下的面積；

mAP是所有類別AP的平均；

目標檢測模型

基于深度學習的目標檢測方法根據(jù)有無區(qū)域提案階段劃分為雙階段模型和單階段檢測模型。

雙階段模型

區(qū)域檢測模型將目標檢測任務分為區(qū)域提案生成、特征提取和分類預測三個階段。在區(qū)域提案生成階段，檢測模型利用搜索算法如選擇性搜索（SelectiveSearch，SS）、EdgeBoxes、區(qū) 域提案網(wǎng) 絡（Region Proposal Network，RPN）等在圖像中搜尋可能包含物體的區(qū)域。在特征提取階段，模型利用深度卷積網(wǎng)絡提取區(qū)域提案中的目標特征。在分類預測階段，模型從預定義的類別標簽對區(qū)域提案進行分類和邊框信息預測。

單階段模型

單階段檢測模型聯(lián)合區(qū)域提案和分類預測，輸入整張圖像到卷積神經(jīng)網(wǎng)絡中提取特征，最后直接輸出目標類別和邊框位置信息。這類代表性的方法有：YOLO、SSD和CenterNet等。

目標檢測研究方向

目標檢測方法可分為檢測部件、數(shù)據(jù)增強、優(yōu)化方法和學習策略四個方面。其中檢測部件包含基準模型和基準網(wǎng)絡；數(shù)據(jù)增強包含幾何變換、光學變換等；優(yōu)化方法包含特征圖、上下文模型、邊框優(yōu)化、區(qū)域提案方法、類別不平衡和訓練策略六個方面，學習策略涵蓋監(jiān)督學習、弱監(jiān)督學習和無監(jiān)督學習。