視頻對(duì)象分割提取的原理與應(yīng)用

出版時(shí)間:2009-3  出版社:科學(xué)出版社  作者:張兆楊  頁(yè)數(shù):214  

內(nèi)容概要

  視頻對(duì)象(VideoObject,VO)分割提取是視頻信號(hào)處理領(lǐng)域研究的前沿問(wèn)題之一,在基于對(duì)象的視頻編碼、智能視頻監(jiān)控系統(tǒng)、人臉檢測(cè)、目標(biāo)識(shí)別、視頻數(shù)據(jù)庫(kù)檢索和視頻摘要等領(lǐng)域有著廣泛的應(yīng)用。本書以視頻對(duì)象分割技術(shù)原理及應(yīng)用為主線,在介紹它所涉及的圖像、視頻信號(hào)處理基礎(chǔ)知識(shí)的基礎(chǔ)上,將其劃分為像素域視頻對(duì)象分割和壓縮域視頻對(duì)象分割方法。對(duì)于像素域視頻對(duì)象分割,根據(jù)目標(biāo)應(yīng)用不同將其分為以分割準(zhǔn)確度為目標(biāo)的像素域視頻對(duì)象分割方法和以實(shí)時(shí)應(yīng)用為目標(biāo)的像素域視頻對(duì)象分割方法兩類。對(duì)于壓縮域視頻對(duì)象分割,圍繞其關(guān)鍵技術(shù)--運(yùn)動(dòng)矢量的致密化和準(zhǔn)確化,DCT系數(shù)的充分化進(jìn)行闡述,并將其從傳統(tǒng)的MPEG-1/2壓縮域拓展到最新的視頻編碼標(biāo)準(zhǔn)H.264/AVC。本書對(duì)上述不同類型的分割方法,結(jié)合國(guó)際上的最新進(jìn)展和作者多年來(lái)的研究成果進(jìn)行了精辟的分析,由淺入深地給出了研究思路和解決方案及其實(shí)現(xiàn)的詳細(xì)步驟,并通過(guò)實(shí)驗(yàn)給予驗(yàn)證和性能評(píng)價(jià)。在此基礎(chǔ)上,示出了典型的應(yīng)用案例。

書籍目錄

前言第1章 視頻對(duì)象分割提取概述1.1 視頻對(duì)象分割提取的基本概念1.1.1 視頻對(duì)象的定義1.1.2 視頻分割與圖像分割的關(guān)系1.2 視頻對(duì)象分割方法的分類與應(yīng)用概況1.2.1 分割方法的分類1.2.2 應(yīng)用概況1.3 本書的結(jié)構(gòu)參考文獻(xiàn)第2章 像素域視頻對(duì)象分割基礎(chǔ)2.1 圖像的預(yù)處理和后處理技術(shù)2.1.1 圖像的濾波處理2.1.2 梯度算子2.1.3 數(shù)學(xué)形態(tài)學(xué)預(yù)/后處理2.2 基于空間域的分割2.2.1 基于區(qū)域的分割2.2.2 基于像素聚類的分割2.2.3 基于分水嶺變換的分割2.3 基于時(shí)間域的分割2.3.1 光流場(chǎng)法2.3.2 幀差法2.3.3 矢量場(chǎng)估計(jì)法2.4 基于時(shí)空融合的對(duì)象分割2.4.1 基于時(shí)空聚類的分割方法2.4.2 基于光流的運(yùn)動(dòng)對(duì)象分割方法2.4.3 基于對(duì)象跟蹤的分割方法2.5 視頻對(duì)象分割的性能評(píng)價(jià)2.5.1 空間準(zhǔn)確度評(píng)價(jià)2.5.2 時(shí)間一致性評(píng)價(jià)參考文獻(xiàn)第3章 以分割準(zhǔn)確度為目標(biāo)的像素域視頻對(duì)象分割方法3.1 基于背景記錄和重建的VO自動(dòng)分割3.1.1 基于背景記錄和變化檢測(cè)的V0分割3.1.2 基于背景重建的V0提取3.2 時(shí)空融合VO分割的典型方法3.2.1 融入時(shí)域信息的分水嶺V0分割的方案組成3.2.2 時(shí)間分割3.2.3 空間分割3.2.4 時(shí)/空融合分割3.2.5 實(shí)驗(yàn)結(jié)果3.3 存在多個(gè)視頻對(duì)象時(shí)的分割方法3.3.1 基于貝葉斯估計(jì)的多視頻對(duì)象分割3.3.2 時(shí)空曲線演化的多個(gè)V0的分割3.4用戶輔助的交互式視頻對(duì)象分割3.4.1 智能剪及其改進(jìn)方法的視頻對(duì)象分割與跟蹤3.4.2 基于種子區(qū)域合并的交互式視頻對(duì)象分割參考文獻(xiàn)第4章 以實(shí)時(shí)應(yīng)用為目標(biāo)的像素域視頻對(duì)象分割方法4.1 細(xì)胞神經(jīng)網(wǎng)絡(luò)基礎(chǔ)4.1.1 細(xì)胞神經(jīng)網(wǎng)絡(luò)模型及其特點(diǎn)和結(jié)構(gòu)4.1.2 細(xì)胞神經(jīng)網(wǎng)絡(luò)的開發(fā)工具4.1.3 CNN模板的設(shè)計(jì)方法簡(jiǎn)介4.1.4 CNN在圖像和視頻處理方面的研究現(xiàn)狀4.2 適合頭肩序列的基于CNN模板的VO分割4.2.1 頭肩序列的特點(diǎn)4.2.2 視頻對(duì)象分割算法4.2.3 分割算法的CNN實(shí)現(xiàn)及實(shí)驗(yàn)結(jié)果4.3 人臉提取算法CNN實(shí)現(xiàn)4.3.1 算法概述4.3.2 模板結(jié)構(gòu)4.3.3 實(shí)驗(yàn)結(jié)果4.4 基于光流和改進(jìn)分水嶺分割算法的cNN實(shí)現(xiàn)4.4.1 以CNN實(shí)現(xiàn)算法的方案4.4.2 CNN模板設(shè)計(jì)4.4.3 實(shí)驗(yàn)結(jié)果參考文獻(xiàn)第5章 壓縮域視頻對(duì)象分割5.1 基于壓縮域視頻對(duì)象分割的基本思路5.2 基于H.264壓縮域的視頻對(duì)象分割方法5.2.1 運(yùn)動(dòng)矢量場(chǎng)歸一化和累積5.2.2 全局運(yùn)動(dòng)補(bǔ)償5.2.3 累積運(yùn)動(dòng)矢量場(chǎng)分割5.2.4 基于匹配矩陣的時(shí)空分割5.2.5 實(shí)驗(yàn)結(jié)果5.3 基于MPEG壓縮域的視頻對(duì)象分割方法5.3.1 提取DC+2AC圖的輪廓特征5.3.2 基于運(yùn)動(dòng)場(chǎng)的分割5.3.3 時(shí)空信息的融合5.3.4 對(duì)象邊緣的精細(xì)化5.3.5 實(shí)驗(yàn)結(jié)果5.4 MPEG壓縮域視覺(jué)關(guān)注度對(duì)象分割5.4.1 場(chǎng)景紋理分析5.4.2 I幀運(yùn)動(dòng)矢量場(chǎng)處理5.4.3 基于DCT系數(shù)和運(yùn)動(dòng)矢量的統(tǒng)計(jì)區(qū)域生長(zhǎng)5.4.4 關(guān)注度對(duì)象提取5.4.5 實(shí)驗(yàn)結(jié)果參考文獻(xiàn)第6章 視頻對(duì)象分割技術(shù)的應(yīng)用6.1 基于視頻對(duì)象的查詢與檢索系統(tǒng)6.1.1 視頻場(chǎng)景的分割6.1.2 聚類與關(guān)鍵幀的提取6.1.3 視頻檢索數(shù)據(jù)庫(kù)的建立6.1.4 基于音頻的瀏覽系統(tǒng)6.2 視頻對(duì)象分割在智能監(jiān)控系統(tǒng)中的應(yīng)用6.2.1 智能監(jiān)控系統(tǒng)的組成6.2.2 運(yùn)動(dòng)對(duì)象檢測(cè)6.2.3 基于場(chǎng)景內(nèi)容的查詢6.3 可視化通信中的人臉對(duì)象分割技術(shù)6.3.1 基于二叉劃分樹的人臉?lè)指罘椒?.3.2 人臉?lè)指钏惴ú襟E6.4 視頻對(duì)象分割在影視資料修復(fù)中的應(yīng)用6.4.1 斑點(diǎn)損傷的修復(fù)算法6.4.2 基于時(shí)空結(jié)合的斑點(diǎn)損傷修復(fù)模型6.4.3 斑點(diǎn)修復(fù)的實(shí)驗(yàn)結(jié)果6.5 壓縮視頻中運(yùn)動(dòng)交通車輛的檢測(cè)6.5.1 視頻對(duì)象平面檢測(cè)和檢索算法6.5.2 車輛檢測(cè)系統(tǒng)的實(shí)驗(yàn)結(jié)果參考文獻(xiàn)

章節(jié)摘錄

  第1章 視頻對(duì)象分割提取概述  進(jìn)入21世紀(jì)以來(lái),隨著社會(huì)信息化的發(fā)展,人們對(duì)多媒體信息的需求不斷增長(zhǎng),其中視覺(jué)信息是極其重要的部分。視覺(jué)信息中視頻是指一個(gè)被觀察系統(tǒng)(如攝像機(jī))所記錄的運(yùn)動(dòng)圖像序列,是人類直接從外界獲得的重要?jiǎng)討B(tài)信息,但由于其數(shù)據(jù)量十分巨大,為便于傳輸和存儲(chǔ),需要進(jìn)行高效的壓縮編碼?! ‖F(xiàn)有的視頻壓縮標(biāo)準(zhǔn),可分為兩類。第一類壓縮標(biāo)準(zhǔn)以JPEG、MPEG1/2、H.261/3/4等為代表,其主要特點(diǎn)是將像素和像素塊作為基本的編碼單元,這類編碼標(biāo)準(zhǔn)已在如數(shù)字電視、視頻通信和VCD/DVD等方面應(yīng)用成功。以基于對(duì)象(內(nèi)容)編碼為特點(diǎn)的第二類壓縮標(biāo)準(zhǔn)MPEG-4除能提供高效的壓縮編碼效率外,還能提供基于對(duì)象的交互功能,使用戶能夠訪問(wèn)(搜索、瀏覽)和操作(剪貼、移動(dòng))場(chǎng)景中的各個(gè)對(duì)象,可更廣泛地延拓應(yīng)用范圍,因此也被稱為第二代編碼標(biāo)準(zhǔn)?! 』趯?duì)象的編碼和交互功能首先需要將場(chǎng)景或視頻序列中的各類對(duì)象(如運(yùn)動(dòng)的汽車、人等前景對(duì)象和靜止的房屋、樹木等背景對(duì)象)分割提取出來(lái),但MPEG-4并沒(méi)有規(guī)定從視頻序列中分割出此類具有語(yǔ)義意義的視頻對(duì)象(videoobject,VO)的方法,而是對(duì)用戶開放,其目的是便于用戶針對(duì)具體應(yīng)用來(lái)設(shè)計(jì)特定的視頻對(duì)象分割算法。然而,語(yǔ)義視頻對(duì)象分割與早期的圖像分割相比更是一項(xiàng)挑戰(zhàn)性的難題,為此自MPEG一4標(biāo)準(zhǔn)誕生后的10年來(lái),國(guó)內(nèi)外包括各大公司、高校和各類研究機(jī)構(gòu)在內(nèi)的學(xué)者和研究人員已進(jìn)行深入、廣泛的研究。目前,盡管還不很完善,但已進(jìn)入應(yīng)用階段,而且應(yīng)用領(lǐng)域已遠(yuǎn)遠(yuǎn)超越了原先僅作為便于高效編碼和對(duì)象交互功能的范圍。

圖書封面

評(píng)論、評(píng)分、閱讀與下載


    視頻對(duì)象分割提取的原理與應(yīng)用 PDF格式下載


用戶評(píng)論 (總計(jì)0條)

 
 

 

250萬(wàn)本中文圖書簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7