出版時(shí)間:2010-5 出版社:國(guó)防工業(yè)出版社 作者:屈丹 等編著 頁(yè)數(shù):495
Tag標(biāo)簽:無(wú)
前言
隨著通信和信息技術(shù)的發(fā)展,特別是網(wǎng)絡(luò)技術(shù)的發(fā)展,海量文本、語(yǔ)音、圖像和視頻等媒體為人們提供了豐富的信息資源。對(duì)廣大用戶來(lái)說(shuō),主要是從海量信息環(huán)境中獲取有用的信息。對(duì)于管理人員來(lái)說(shuō),除了信息獲取,還需要對(duì)海量信息的內(nèi)容進(jìn)行監(jiān)管。 無(wú)論是為了獲取有價(jià)值的信息,還是對(duì)海量信息的內(nèi)容進(jìn)行監(jiān)管,在廣泛收集信息的同時(shí),需要對(duì)獲得的信息進(jìn)行有效的采集、高效的內(nèi)容識(shí)別、深層的檢索與挖掘。在海量信息智能處理中,信息采集是基礎(chǔ)、信息內(nèi)容識(shí)別是核心、信息檢索與挖掘是手段、信息獲取與監(jiān)管是目的?! ⌒畔⒐こ檀髮W(xué)信息工程學(xué)院“智能信息處理”方向長(zhǎng)期從事文本分析與理解、語(yǔ)音處理與識(shí)別、圖像/視頻處理與識(shí)別、多源信息融合、信息檢索與挖掘等前沿學(xué)科領(lǐng)域的教學(xué)與科研,獲得了國(guó)家社科基金(重大)、國(guó)家自然科學(xué)基金、國(guó)家“863”、國(guó)防預(yù)研等多個(gè)項(xiàng)目的資助。“智能信息處理”方向的多名作者在總結(jié)和提升多年教學(xué)、科研成果的基礎(chǔ)上,編寫了這套《智能信息處理》叢書。國(guó)防工業(yè)出版社為該叢書的出版給予了大力支持?! 吨悄苄畔⑻幚怼穮矔?個(gè)分冊(cè),比較系統(tǒng)、全面地介紹了智能信息處理技術(shù)及其應(yīng)用,重點(diǎn)闡述了文本、語(yǔ)音、圖像及視頻等媒體的內(nèi)容識(shí)別、檢索、挖掘和監(jiān)管。該叢書可作為計(jì)算機(jī)科學(xué)與技術(shù)、電子工程、信息與通信工程、自動(dòng)控制、指揮自動(dòng)化、情報(bào)學(xué)、圖書館學(xué)、信息管理等相關(guān)專業(yè)方向的高年級(jí)本科生和研究生相關(guān)課程的教材和相關(guān)領(lǐng)域的科研、工程技術(shù)人員的參考書。
內(nèi)容概要
本書從VoIP通信過(guò)程出發(fā),以傳統(tǒng)語(yǔ)音識(shí)別技術(shù)為基礎(chǔ),沿著PSTN網(wǎng)信號(hào)處理和IP包信號(hào)處理兩個(gè)主線進(jìn)行研究,以語(yǔ)音識(shí)別的前端處理、特征提取、模型建立、后端處理過(guò)程進(jìn)行組織。針對(duì)VoIP語(yǔ)音識(shí)別系統(tǒng)實(shí)用化的問(wèn)題,給出了一些改善語(yǔ)音識(shí)別系統(tǒng)性能的關(guān)鍵技術(shù),力求使得VoIP語(yǔ)音識(shí)別能走出實(shí)驗(yàn)室,向?qū)嵱冒l(fā)展。 全書共14章,分為:緒論、VoIP語(yǔ)音編碼標(biāo)準(zhǔn)、語(yǔ)音信號(hào)和話帶數(shù)據(jù)檢測(cè)、VoIP信道檢測(cè)、語(yǔ)音信號(hào)的特征提取、編解碼失配補(bǔ)償、通話模式分析、VoIP協(xié)議分析及數(shù)據(jù)獲取、丟包處理、碼流特征提取、特征選擇與特征變換、語(yǔ)音識(shí)別的模型、穩(wěn)健性識(shí)別技術(shù)和語(yǔ)音識(shí)別應(yīng)用。全書對(duì)VoIP語(yǔ)音處理識(shí)別技術(shù)進(jìn)行了詳盡的、深入淺出的講解,并根據(jù)作者的研究與實(shí)驗(yàn)結(jié)果提供了大量的實(shí)際參數(shù)、圖表,與實(shí)際工作聯(lián)系緊密,具有很強(qiáng)的可操作性與實(shí)用性。章節(jié)之間緊密配合、前后呼應(yīng),具有很強(qiáng)的系統(tǒng)性。同時(shí),通過(guò)書中的研究過(guò)程和研究方法,讀者能夠在以后的研究工作中受到很大的啟發(fā)。 本書可作為高等院校理工科通信和信息處理及相關(guān)專業(yè)的高年級(jí)本科生和(碩士、博士)研究生的教材或參考書,也可供從事信息處理、通信工程等專業(yè)的研究人員參考。
作者簡(jiǎn)介
屈丹,女,吉林九臺(tái)人,1974年9月出生.博士,信息工程大學(xué)信息工程學(xué)院講師。主要從事語(yǔ)音處理與識(shí)別、信息融合等前沿學(xué)科的教學(xué)與科研。主持國(guó)家“863”課題、軍隊(duì)重點(diǎn)科研項(xiàng)目,鄭州市重點(diǎn)科技攻關(guān)項(xiàng)目等5項(xiàng);作為主要技術(shù)負(fù)責(zé)人,參與國(guó)家自然科學(xué)基金項(xiàng)目、軍隊(duì)重點(diǎn)科研
書籍目錄
第1章 緒論 1.1 VoIP的基本概念和系統(tǒng)組成 1.2 語(yǔ)音識(shí)別的基本原理與研究?jī)?nèi)容 1.3 傳統(tǒng)語(yǔ)音識(shí)別的發(fā)展歷程 1.4 VoIP語(yǔ)音識(shí)別的發(fā)展歷程 參考文獻(xiàn) 第2章 VoIP語(yǔ)音編碼標(biāo)準(zhǔn) 2.1 G.711語(yǔ)音編碼 2.2 G.729語(yǔ)音編碼 2.3 G.723.1語(yǔ)音編碼 參考文獻(xiàn) 第3章 語(yǔ)音和話帶數(shù)據(jù)檢測(cè) 3.1 話帶數(shù)據(jù)簡(jiǎn)介 3.2 語(yǔ)音和話帶數(shù)據(jù)波形的特點(diǎn) 3.3 語(yǔ)音和話帶數(shù)據(jù)識(shí)別的特征分析 3.4 語(yǔ)音和話帶數(shù)據(jù)分離方法 3.5 語(yǔ)音與話帶數(shù)據(jù)檢測(cè)技術(shù)應(yīng)用 參考文獻(xiàn) 附錄 第4章 VoIP信道檢測(cè) 4.1 聲道參數(shù) 4.2 語(yǔ)音信號(hào)統(tǒng)計(jì)參數(shù) 4.3 靜態(tài)信噪比 4.4 非自然周期性參數(shù) 4.5 啞聲參數(shù)與中斷參數(shù) 4.6 基于支持矢量機(jī)的VoIP信道檢測(cè)方法 參考文獻(xiàn) 第5章 語(yǔ)音信號(hào)的特征提取 5.1 基音周期 5.2 線性預(yù)測(cè)參數(shù) 5.3 線譜對(duì)(LSP)參數(shù) 5.4 倒譜系數(shù)及差分參數(shù) 5.5 感覺加權(quán)的線性預(yù)測(cè)(PLP)特征 5.6 高階信號(hào)譜類特征 參考文獻(xiàn) 第6章 編解碼失配補(bǔ)償 6.1 編解碼失配影響 6.2 常用編解碼失配補(bǔ)償方法 6.3 基于編碼失真的加權(quán)GMM模型算法 6.4 編碼自動(dòng)匹配方法 6.5 統(tǒng)計(jì)匹配特征變換失配補(bǔ)償算法 6.6 分?jǐn)?shù)歸一化補(bǔ)償算法 參考文獻(xiàn) 第7章 通話模式分析 7.1 通話模式分析的基本概念與研究?jī)?nèi)容 7.2 通話模式分析的基本方法 7.3 多人的說(shuō)話人識(shí)別方法 7.4 電信網(wǎng)特有噪聲檢測(cè)算法 參考文獻(xiàn) 第8章 VoIP協(xié)議分析及數(shù)據(jù)獲取 8.1 VoIP協(xié)議簡(jiǎn)介 8.2 SIP協(xié)議通信流程及識(shí)別 8.3 H.323協(xié)議通信流程與識(shí)別 參考文獻(xiàn) 第9章 丟包處理 9.1 網(wǎng)絡(luò)丟包模型 9.2 網(wǎng)絡(luò)丟包對(duì)說(shuō)話人識(shí)別的影響 9.3 網(wǎng)絡(luò)丟包處理技術(shù) 9.4 語(yǔ)音識(shí)別系統(tǒng)中的丟包補(bǔ)償方法 參考文獻(xiàn) 第10章 碼流特征提取 10.1 碼流語(yǔ)音識(shí)別的原理 10.2 G.729碼流特征提取 10.3 G.723.1碼流特征提取 10.4 GSM碼流特征提取 10.5 碼流特征提取實(shí)驗(yàn) 參考文獻(xiàn) 第11章 特征選擇與特征變換 11.1 特征選擇的基本概念 11.2 類的可分性判據(jù) 11.3 特征選擇的方法 11.4 線性判別分析——LDA 11.5 主分量分析——PCA 11.6 獨(dú)立分量分析 11.7 特征變換舉例 參考文獻(xiàn) 第12章 語(yǔ)音識(shí)別的模型 12.1 動(dòng)態(tài)時(shí)間規(guī)整 12.2 隱馬爾可夫模型 12.3 分類模型——SVM 12.4 人工神經(jīng)網(wǎng)絡(luò) 12.5 高斯混合模型(GMM) 12.6 動(dòng)態(tài)貝葉斯網(wǎng)絡(luò) 參考文獻(xiàn) 第13章 穩(wěn)健性識(shí)別技術(shù) 13.1 穩(wěn)健性識(shí)別技術(shù)概述 13.2 語(yǔ)音增強(qiáng) 13.3 信道補(bǔ)償 13.4 說(shuō)話人自適應(yīng)技術(shù) 13.5 說(shuō)話人歸一化技術(shù) 參考文獻(xiàn) 第14章 語(yǔ)音識(shí)別應(yīng)用 14.1 說(shuō)話人識(shí)別 14.2 語(yǔ)言辨識(shí) 14.3 關(guān)鍵詞識(shí)別 14.4 連續(xù)語(yǔ)音識(shí)別 14.5 情感識(shí)別 參考文獻(xiàn)
章節(jié)摘錄
三、傳送 在這個(gè)通道中,全部網(wǎng)絡(luò)被看成一個(gè)整體,持續(xù)不斷地從輸入端接收語(yǔ)音包,然后在一定時(shí)間f內(nèi)將其傳送到網(wǎng)絡(luò)輸出端。時(shí)間£可以在某個(gè)范圍內(nèi)變化,反映了網(wǎng)絡(luò)傳輸中的抖動(dòng)。網(wǎng)絡(luò)中的中間節(jié)點(diǎn)檢查每個(gè)IP數(shù)據(jù)附帶的尋址信息,并使用這個(gè)信息把該數(shù)據(jù)報(bào)轉(zhuǎn)發(fā)到目的地路徑上的下一站。網(wǎng)絡(luò)鏈路可以是支持IP數(shù)據(jù)流的任何拓?fù)浣Y(jié)構(gòu)或訪問(wèn)方法。 四、IP包一數(shù)據(jù)的轉(zhuǎn)換 目的地VoIP設(shè)備接收這個(gè)IP數(shù)據(jù)報(bào)并開始處理。網(wǎng)絡(luò)級(jí)提供一個(gè)可變長(zhǎng)度的緩沖器,用來(lái)調(diào)節(jié)網(wǎng)絡(luò)產(chǎn)生的抖動(dòng)。該緩沖器可容納許多語(yǔ)音包,用戶可選擇緩沖器的大小。小的緩沖器產(chǎn)生延遲較小,但不能調(diào)節(jié)大的抖動(dòng)。其次,解碼器將經(jīng)編碼的語(yǔ)音包解壓縮后產(chǎn)生新的語(yǔ)音包,這個(gè)模塊也可以按幀進(jìn)行操作,完全和解碼器的長(zhǎng)度相同。若幀長(zhǎng)度為15ms,則60ms的語(yǔ)音包被分成4幀,然后它們被解碼還原成60ms的語(yǔ)音數(shù)據(jù)流送人解碼緩沖器。在數(shù)據(jù)報(bào)的處理過(guò)程中,去掉尋址和控制信息,保留原始的源數(shù)據(jù),然后把這個(gè)源數(shù)據(jù)提供給解碼器。 五、數(shù)字語(yǔ)音轉(zhuǎn)換為模擬語(yǔ)音 播放驅(qū)動(dòng)器將緩沖器中的語(yǔ)音樣點(diǎn)(60ms,480個(gè))取出送入聲卡,通過(guò)揚(yáng)聲器按預(yù)定的頻率(例如8kHz)播出。 簡(jiǎn)而言之,語(yǔ)音信號(hào)在IP網(wǎng)絡(luò)上的傳送要經(jīng)過(guò)從模擬信號(hào)到數(shù)字信號(hào)的轉(zhuǎn)換、數(shù)字語(yǔ)音封裝成IP分組、IP分組通過(guò)網(wǎng)絡(luò)的傳送、IP分組的解包和數(shù)字語(yǔ)音還原到模擬信號(hào)等過(guò)程。整個(gè)過(guò)程如圖1.2所示。
圖書封面
圖書標(biāo)簽Tags
無(wú)
評(píng)論、評(píng)分、閱讀與下載