近日,中國林科院資源信息研究所研究員符利勇率領(lǐng)研究團隊在無人機圖像處理研究領(lǐng)域取得重要進展,研究成果以“Robust Capped L1-norm Twin Support Vector Machine”為題,在國際計算機領(lǐng)域一區(qū)、TOP期刊《Neural Networks》(影響因子為7.20)上發(fā)表。課題組聯(lián)合培養(yǎng)的碩士研究生王春燕、南京林業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院業(yè)巧林副教授、資源信息研究所羅鵬助理研究員為論文共同第一作者,符利勇研究員為通訊作者。研究得到了“十三五”國家重點研發(fā)計劃“陸地生態(tài)系統(tǒng)碳源匯監(jiān)測技術(shù)及指標體系”子課題的資助。
在許多應(yīng)用問題中,如森林資源監(jiān)測、林業(yè)遙感參數(shù)提取和森林生物量估計等,物種分類是一個必不可少的研究內(nèi)容。近年來,孿生支持向量機作為一個有效的分類工具,因具較傳統(tǒng)支持向量機在效率和性能上更好的優(yōu)勢而一直是支持向量機的研究熱點問題。然而,現(xiàn)有的孿生支持向量機技術(shù)無法保證獲取最好的魯棒性。
在大數(shù)據(jù)時代背景下,數(shù)據(jù)分布日趨復(fù)雜,且以各種形式呈現(xiàn),如林業(yè)遙感圖像,往往包含了大量的噪聲或野值,因此,構(gòu)建魯棒孿生支持向量機,對推動機器學(xué)習(xí)和模式識別理論有著深遠的意義。所以,本研究提出了一種切距離度量下孿生支持向量機方法,其思路在于將那些超過閾值的距離賦予固定的較小的值,以便減少野值因到平面距離過大對模型的支配。所構(gòu)建的目標問題具非凸和非平滑性,為了獲得解,設(shè)計了一個有效的求解策略,并從理論上證明了該算法的收斂性和解的存在性。在公共數(shù)據(jù)集上,驗證了該算法的有效性。該研究成果,進一步為無人機圖像技術(shù)在森林參數(shù)提取和森林生物量估計等研究提供了堅實的理論基礎(chǔ)。(符利勇王文泉)