基于形狀特征的昆蟲圖像語(yǔ)義標(biāo)注*:圖像語(yǔ)義分割
發(fā)布時(shí)間:2020-02-25 來源: 感悟愛情 點(diǎn)擊:
摘要:鑒于人工對(duì)昆蟲圖像進(jìn)行分類標(biāo)注費(fèi)時(shí)費(fèi)力,而且由于主觀因素的影響,使得標(biāo)注結(jié)果不統(tǒng)一,造成后續(xù)對(duì)昆蟲圖像的檢索結(jié)果不理想,本文提出了基于圖像形狀特征的昆蟲圖像語(yǔ)義標(biāo)注方法。首先介紹了圖像中目標(biāo)對(duì)象的特征提取;詳細(xì)闡述了基于圖像底層特征進(jìn)行聚類分析實(shí)現(xiàn)標(biāo)注的過程;最后給出了用以上方法在VC++6.0環(huán)境中實(shí)現(xiàn)對(duì)昆蟲圖像標(biāo)注的的實(shí)驗(yàn)結(jié)果。實(shí)驗(yàn)證明該方法不僅可以彌補(bǔ)傳統(tǒng)昆蟲學(xué)家手工對(duì)昆蟲圖像進(jìn)行標(biāo)注的方法的不足,同時(shí)能夠給用戶提供更為實(shí)時(shí)、準(zhǔn)確的昆蟲圖像語(yǔ)義標(biāo)注結(jié)果。
關(guān)鍵字: 特征提取;圖像分割;圖像標(biāo)注
中圖分類號(hào):TP 391.4 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-2851(2010)08-0114-01
圖像標(biāo)注是圖像檢索中重要的一項(xiàng)工作,理想的標(biāo)注結(jié)果可以使圖像檢索為用戶提供實(shí)時(shí)的、準(zhǔn)確的需求對(duì)象。昆蟲圖像處理是圖像處理的一個(gè)新的年輕領(lǐng)域。本文提出的基于形狀特征的昆蟲圖像標(biāo)注是計(jì)算機(jī)對(duì)昆蟲圖像進(jìn)行有效管理和利用的一個(gè)突破性進(jìn)展。其主要思想通過對(duì)圖像中目標(biāo)對(duì)象的形狀特征做聚類分析,完成對(duì)昆蟲圖像的中目標(biāo)對(duì)象的分類識(shí)別,并與昆蟲學(xué)的領(lǐng)域知識(shí)相關(guān)聯(lián)給出標(biāo)注信息。
一、實(shí)現(xiàn)過程及方法
(一)研究對(duì)象及其特點(diǎn)。在實(shí)際中昆蟲個(gè)體可能具有的任何屬性都是其特征,包括昆蟲的形態(tài)特征、生化特征、生理特征等,這些特征都可以作為我們識(shí)別某一種昆蟲的依據(jù)。但在計(jì)算機(jī)中,只能由昆蟲圖像本身的特征來區(qū)別不同的昆蟲。本文主要針對(duì)昆蟲類中無(wú)翅亞綱的五大目昆蟲圖像進(jìn)行標(biāo)注。該五大目分別是原尾目、彈尾目、雙尾目、石?目、衣魚目,它們的共同特征是無(wú)翅,體型微小,但它們的外形差異較大,可以作為它們相互間的一個(gè)區(qū)分點(diǎn)。
(二)實(shí)現(xiàn)過程
實(shí)現(xiàn)的模塊流程如下圖[1,2]:
1.形狀特征提取算法描述[3];跓o(wú)翅亞綱的五大目昆蟲本身外在形狀的顯著差異,本文主要利用昆蟲圖像形狀特征作為分類標(biāo)注的依據(jù)。形狀特征可以分為兩類:邊界特征和區(qū)域特征。基于邊界的描述方法僅僅只利用了邊界信息,丟失了形狀的內(nèi)部?jī)?nèi)容,而且在目標(biāo)形狀脫節(jié)不能獲取邊界信息時(shí)難以適用。而基于區(qū)域的描述方法利用了目標(biāo)形狀的內(nèi)部像素信息,可以應(yīng)用于一般場(chǎng)合,由于目前所有的區(qū)域描述方法提取的均是形狀的空域特征,因此該方法對(duì)噪聲和形狀的細(xì)微變化比較敏感,抗干擾能力不強(qiáng)。因此本文使用文獻(xiàn)[3]提出的改進(jìn)的傅里葉描述符,該方法提取的是圖像中目標(biāo)對(duì)象二維極坐標(biāo)傅里葉變換后的頻譜特征,可以出色地捕獲目標(biāo)形狀的徑向和環(huán)向特征,可以以一定的精度很好地描述目標(biāo)物體的形狀特征。而且可以對(duì)形狀的相似性進(jìn)行定量的判別,其抗干擾能力強(qiáng),通用性較高。
2.圖像標(biāo)注。本文實(shí)現(xiàn)標(biāo)注的主要思想是通過圖像模式識(shí)別中動(dòng)態(tài)聚類算法對(duì)待標(biāo)注圖像首先進(jìn)行分類,在獲取了分類號(hào)后通過與關(guān)鍵字庫(kù)關(guān)聯(lián),從而實(shí)現(xiàn)圖像的標(biāo)注。本文的整個(gè)實(shí)驗(yàn)過程是在VC++6.0的環(huán)境下實(shí)現(xiàn),關(guān)鍵字庫(kù)是在SQL Server數(shù)據(jù)庫(kù)下建立的一個(gè)二維表。
(1) 使用樣本圖像獲得聚類中心
動(dòng)態(tài)聚類算法的主要思想是選擇若干樣品作為聚類中心,再按照某種聚類準(zhǔn)則,將其余樣品歸入最近的中心,得到初始分類。然后判斷初始分類是否合理,若不合理則按照特定規(guī)則重新修改不合理的分類,如此反復(fù)迭代,直到分類合理。本文采用K均值聚類算法,該算法能使聚類域中所有樣品到聚類中心的距離平方和最小。選取K=5,以原尾目、彈尾目、雙尾目、石?目、衣魚目五類昆蟲為分類對(duì)象,首先使用K均值算法在180幅樣本圖像集上進(jìn)行分類,目的是獲取一個(gè)穩(wěn)定的聚類中心,在聚類算法中,由于初始的聚類中心為單個(gè)樣品,所以計(jì)算樣品到聚類中心距離采用歐氏距離,公式為:
Dij2 =(Xi-Xj)T(Xi-Xj)=Xi-Xj2=(xik-xjk)2(1)
其中n為特征向量X的維數(shù),xik代表圖像的某一特征值。
后續(xù)在聚類中心不斷更新的過程中,計(jì)算樣品到聚類中心的距離的公式為:
D2(X,w) =D2(X,X(w))=xk-xk(w)2 (2)
X(w)為第w的中心點(diǎn),即以w中所有樣品特征的平均值作為類中心。
(2)未知圖像的聚類及標(biāo)注。在以上獲得的聚類中心的基礎(chǔ)上計(jì)算待測(cè)樣品X到的中心點(diǎn)X(w)的距離,采用公式(2)進(jìn)行計(jì)算,根據(jù)聚類結(jié)果獲得分類號(hào),再根據(jù)分類號(hào)查詢關(guān)鍵字庫(kù),從而獲得圖像的標(biāo)注信息。標(biāo)注結(jié)果如圖4所示。
二、實(shí)驗(yàn)結(jié)論
實(shí)驗(yàn)表明利用目標(biāo)對(duì)象的形狀特征對(duì)昆蟲圖像進(jìn)行標(biāo)注,能夠取得較理想的標(biāo)注結(jié)果,但此方法僅適合于背景簡(jiǎn)單的昆蟲圖像標(biāo)注。
基于形狀特征的昆蟲圖像語(yǔ)義標(biāo)注在實(shí)現(xiàn)時(shí)還存在以下問題:首先,若圖像中的昆蟲對(duì)象與背景顏色相近時(shí),無(wú)法較合理的將目標(biāo)對(duì)象提取出來;其次,若背景構(gòu)成復(fù)雜時(shí)也無(wú)法較準(zhǔn)確提取對(duì)象,怎樣將目標(biāo)對(duì)象能更加全面、準(zhǔn)確的提取出來,還有待于進(jìn)一步的研究。在實(shí)現(xiàn)分類時(shí),為形成較穩(wěn)定的聚類中心選擇定量的圖像數(shù)量進(jìn)行預(yù)分類,該方法的效率在巨量圖像面前成本會(huì)急劇增加,有待于進(jìn)一步改進(jìn);最后,本文在實(shí)現(xiàn)標(biāo)注時(shí)只使用了昆蟲圖像的形狀特征,關(guān)于昆蟲圖像的顏色和紋理特征在昆蟲圖像標(biāo)注上的應(yīng)用需進(jìn)一步研究學(xué)習(xí)。
參考文獻(xiàn)
[1]楊淑瑩.VC++圖像處理程序設(shè)計(jì)[M].北京:清華大學(xué)出版社,2003
[2]楊淑瑩.圖像模式識(shí)別[M].北京:清華大學(xué)出版社,2005
[3]范春年,傅德勝.一種改進(jìn)的二維傅里葉描述子在基于形狀的圖像檢索中的應(yīng)用[J].武漢理工大學(xué)學(xué)報(bào), 2004,28(2):18-21
相關(guān)熱詞搜索:語(yǔ)義 昆蟲 標(biāo)注 基于形狀特征的昆蟲圖像語(yǔ)義標(biāo)注* 昆蟲圖像特征研究 圖像處理軟件
熱點(diǎn)文章閱讀