這篇筆記,僅僅是對(duì)選擇性算法介紹一下原理性知識(shí),不對(duì)公式進(jìn)行推倒.
前言:
這篇論文介紹的是,如果快速的找到的可能是物體目標(biāo)的區(qū)域,不像使用傳統(tǒng)的滑動(dòng)窗口來(lái)暴力進(jìn)行區(qū)域識(shí)別.這里是使用算法從多個(gè)維度對(duì)找到圖片中,可能的區(qū)域目標(biāo),減少目標(biāo)碎片,提升物體檢測(cè)效率. 下面是這篇文章的筆記:
介紹及引言:
圖片是分層次的,比如下圖中a:
沙拉和匙在沙拉碗里,而碗又在桌子上,另外桌子和木頭有關(guān)或者說(shuō)桌子和桌子上的所有東西有關(guān).所以圖片中的目標(biāo)是有層次的. 圖片分割應(yīng)該按層次來(lái),也不存在使用單個(gè)策略這樣通用的方法來(lái)進(jìn)行圖片分割,所以對(duì)圖片分割都是基于多個(gè)策略,但是這樣又會(huì)在合并區(qū)域的時(shí)候產(chǎn)生沖突. 比如說(shuō)上圖中的b圖,貓可以使用顏色進(jìn)行分割,但是它們的紋理是一樣的. 相反的 ; 圖C中的變色龍和周圍的葉子在顏色上是相似的,但是在紋理上確實(shí)不同的.最后,圖d中,汽車輪子和汽車在顏色和紋理上都是不同的,但是和汽車的形狀吻合度很高. 對(duì)于這三個(gè)圖,采用他們其中的一種視覺(jué)特征是無(wú)法來(lái)對(duì)它們進(jìn)行圖片分割的.
在這篇文章中,作者結(jié)合直覺(jué)分割算法和窮舉搜索算法來(lái)提出這個(gè)selective search(選擇性搜索)算法,使用直覺(jué)分割算法是希望達(dá)到結(jié)合圖片的結(jié)構(gòu)層次從下至上來(lái)分割,來(lái)產(chǎn)生目標(biāo)區(qū)域. 使用窮舉搜索算法的目的是得到所有可能是目標(biāo)的區(qū)域. 選擇性搜索算法,使用的是多樣化在抽樣算法