出版時間:2012-7 出版社:科學(xué)出版社 作者:苗奪謙、王國胤、姚一豫、梁吉業(yè)、吳偉志、張燕平 頁數(shù):320 字?jǐn)?shù):427000
內(nèi)容概要
云模型是研究定性概念與定量數(shù)值之間相互轉(zhuǎn)換的不確定性認(rèn)知模型。粒計算是當(dāng)前計算智能研究領(lǐng)域中模擬人類思維和解決復(fù)雜問題的新方法。它覆蓋了所有有關(guān)粒度的理論、方法和技術(shù),是研究復(fù)雜問題求解、海量數(shù)據(jù)挖掘和模糊信息處理等問題的有力工具?!对颇P团c粒計算》介紹云模型與粒計算交叉研究的最新進(jìn)展,由國內(nèi)外相關(guān)領(lǐng)域的華人學(xué)者撰文14章,內(nèi)容涉及云模型、高斯云的數(shù)學(xué)性質(zhì)、云模型與相近概念的關(guān)系、區(qū)間集、區(qū)間值信息系統(tǒng)的粒計算模型與方法、多粒度粗糙集、粒計算模型的特性分析與比較、云計算環(huán)境下層次粗糙集模型約簡算法、基于粒計算的聚類分析、并行約簡與F-粗糙集、單調(diào)性分類學(xué)習(xí)、不確定性研究中若干問題的探討、基于云模型的文本分類應(yīng)用、數(shù)據(jù)挖掘算法的云實現(xiàn)。
《云模型與粒計算》可供計算機(jī)、自動化等相關(guān)專業(yè)的研究人員、教師、研究生、高年級本科生和工程技術(shù)人員參考。
作者簡介
苗奪謙、王國胤、姚一豫、梁吉業(yè)、吳偉志、張燕平
書籍目錄
前言第1章 雙向認(rèn)知計算模型——云模型1.1 引言1.2 正態(tài)分布與正態(tài)隸屬函數(shù)1.3 云模型1.3.1 云模型的定義1.3.2 云模型的數(shù)字特征1.3.3 正態(tài)云模型的遞歸定義及其數(shù)學(xué)性質(zhì)1.3.4 云發(fā)生器1.3.5 雙向認(rèn)知計算模型1.4 本章小結(jié)參考文獻(xiàn)第2章 高斯云的數(shù)學(xué)性質(zhì)2.1 高斯云分布2.2 高斯云的數(shù)學(xué)性質(zhì)2.2.1 高斯云的數(shù)字特征2.2.2 高斯云的期望曲線2.2.3 高斯云的霧化特性2.2.4 高階高斯云的數(shù)字特征2.3 高斯云的參數(shù)對峰度的影響分析2.4 高斯云的冪律特性實驗2.5 本章小結(jié)參考文獻(xiàn)第3章 云模型與相近概念的關(guān)系3.1 二型Fuzzy集3.1.1 二型Fuzzy集的定義3.1.2 二型Fuzzy集的運(yùn)算3.1.3 區(qū)間值Fuzzy集3.1.4 Gaussian二型Fuzzy集3.1.5 二型Fuzzy集的嵌入?yún)^(qū)間值Fuzzy集3.1.6 m 型Fuzzy集與Genuine集3.1.7 區(qū)間集與陰影集3.2 直覺Fuzzy集3.2.1 直覺Fuzzy集的定義3.2.2 直覺Fuzzy集的運(yùn)算3.2.3 區(qū)間值直覺Fuzzy集3.3 Neumaier云3.3.1 Neumaier云的定義3.3.2 離散云3.3.3 連續(xù)云與潛云3.4 Fuzzy概率集3.4.1 隨機(jī)集3.4.2 Fuzzy概率集3.4.3 Bifuzzy概率集和區(qū)間值概率集3.5 Soft集3.5.1 Soft集的定義3.5.2 Soft集的運(yùn)算3.6 云模型3.6.1 云模型的定義3.6.2 云模型算法3.6.3 正態(tài)云生成的區(qū)間值Fuzzy集3.7 云集3.7.1 各類集合的關(guān)系3.7.2 云集3.8 本章小結(jié)參考文獻(xiàn)第4章 區(qū)間集4.1 引言4.2 不精確概念及其表示4.3 區(qū)間集4.3.1 區(qū)間集與部分已知概念4.3.2 區(qū)間集與概念近似4.4 區(qū)間集代數(shù)4.4.1 冪代數(shù)4.4.2 區(qū)間集運(yùn)算4.4.3 基于包含序的區(qū)間集代數(shù)4.4.4 基于知識序的區(qū)間集代數(shù)4.5 基于不完備信息表的區(qū)間集構(gòu)造方法4.6 區(qū)間集與其他理論的聯(lián)系4.6.1 區(qū)間集與Kleene三值邏輯4.6.2 區(qū)間集與粗糙集4.6.3 區(qū)間集與三支決策4.6.4 區(qū)間集、模糊集和云模型4.7 本章小結(jié)參考文獻(xiàn)第5章 區(qū)間值信息系統(tǒng)的粒計算模型與方法5.1 引言5.2 基礎(chǔ)概念5.2.1 不可分辨關(guān)系和近似域5.2.2 決策系統(tǒng)中的不確定性度量5.3 區(qū)間值決策系統(tǒng)的不確定性度量5.3.1 區(qū)間值的相似關(guān)系5.3.2 相似類和決策類5.3.3 ?-條件熵5.3.4 不確定性度量和毴灢粗糙決策熵5.4 實驗5.5 本章小結(jié)參考文獻(xiàn)第6章 多粒度粗糙集6.1 問題描述6.2 樂觀多粒度粗糙集6.2.1 Pawlak粗糙集理論6.2.2 樂觀粗糙近似6.2.3 多粒度粗糙集中的幾個度量6.2.4 特征選擇6.3 悲觀多粒度粗糙集6.3.1 悲觀粗糙近似6.3.2 粗糙成員函數(shù)6.3.3 多粒度粗糙集中的規(guī)則6.4 本章小結(jié)參考文獻(xiàn)第7章 粒計算模型的特性分析與比較7.1 引言7.2 不確定性表示方法7.2.1 隸屬度的方法7.2.2 粗糙集的表示方法7.2.3 商空間的表示方法7.3 粒計算表示不確定性方法之間的關(guān)系7.3.1 隸屬度函數(shù)表示方法與商空間鏈表示方法的關(guān)系7.3.2 粗糙集的表示方法與商空間鏈表示方法之間的關(guān)系7.3.3 云模型與二型模糊之間的關(guān)系7.4 問題求解方法的比較7.5 本章小結(jié)參考文獻(xiàn)第8章 云計算環(huán)境下層次粗糙集模型約簡算法8.1 層次粗糙集模型8.1.1 引言8.1.2 概念層次8.1.3 基于云模型的概念提取及概念提升8.1.4 層次粗糙集模型8.2 云計算技術(shù)8.2.1 云計算介紹8.2.2 MapReduce技術(shù)8.3 云計算環(huán)境下層次粗糙集模型約簡算法8.3.1 云計算環(huán)境下知識約簡算法中的并行性分析8.3.2 云計算環(huán)境下計算層次編碼決策表算法8.3.3 云計算環(huán)境下層次粗糙集模型約簡算法的研究8.4 實驗與分析8.4.1 理論分析8.4.2 實驗結(jié)果8.4.3 實驗分析8.5 本章小結(jié)參考文獻(xiàn)第9章 基于粒計算的聚類分析9.1 引言9.2 粒度計算與聚類分析的關(guān)系9.3 粒聚類的基本方法9.3.1 模糊聚類分析9.3.2 粗糙集聚類分析9.3.3 商空間聚類分析9.4 基于融合的粒度模型的聚類分析9.4.1 模糊集與粗糙集的結(jié)合9.4.2 模糊商空間9.5 多粒度聚類若干問題的研究9.5.1 多粒度聚類中粒子的轉(zhuǎn)換問題9.5.2 約簡集粒度的精準(zhǔn)性9.5.3 多粒度快速聚類算法9.6 基于多粒度聚類的問題求解應(yīng)用舉例:粗糙RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法9.6.1 粗糙RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法9.6.2 粗糙RBF神經(jīng)網(wǎng)絡(luò)的可用性與可靠性實驗9.7 本章小結(jié)參考文獻(xiàn)第10章 并行約簡與F-粗糙集10.1 粗糙集基本知識10.2 F-粗糙集10.3 并行約簡定義與性質(zhì)10.4 并行約簡算法10.4.1 基于屬性重要度矩陣的并行約簡算法10.4.2 基于屬性重要度矩陣的并行約簡算法的優(yōu)化10.4.3 基于F灢屬性重要度的并行約簡算法10.4.4 (F,ε)-并行約簡10.5 決策系統(tǒng)的分解10.6 本章小結(jié)參考文獻(xiàn)第11章 單調(diào)性分類學(xué)習(xí)11.1 引言11.2 基于優(yōu)勢關(guān)系粗糙集的單調(diào)性分類分析11.3 基于模糊偏好粗糙集的單調(diào)性分類分析11.4 基于排序熵模型的單調(diào)性分類分析11.4.1 Shannon信息熵11.4.2 有序信息熵11.5 基于排序熵的單調(diào)性決策樹11.5.1 程序描述11.5.2 性質(zhì)研究11.5.3 在人工數(shù)據(jù)上的實驗11.6 本章小結(jié)參考文獻(xiàn)第12章 不確定性研究中若干問題的探討12.1 隸屬度的不確定性問題12.2 運(yùn)算法則的不確定性問題12.3 模糊運(yùn)算與邏輯運(yùn)算問題12.3.1 模糊運(yùn)算12.3.2 邏輯運(yùn)算12.4 排序的不確定性問題12.5 截集水平的不確定性問題12.6 Fuzzy集合的互補(bǔ)律問題12.7 集合的統(tǒng)一問題12.8 本章小結(jié)參考文獻(xiàn)第13章 基于云模型的文本分類應(yīng)用13.1 云模型在文本挖掘中的理論擴(kuò)充13.1.1 基于VSM模型的文本知識表示13.1.2 基于信息表的文本知識表示13.1.3 基于云模型的文本信息表轉(zhuǎn)換13.1.4 基于云相似度的文本相似度量13.2 文本分類及其常用方法13.2.1 文本分類概述13.2.2 文本分類常用方法13.2.3 性能分析13.2.4 文本分類模型的評估13.3 基于云模型與粒計算的文本分類13.3.1 虛擬泛概念樹及概念躍升13.3.2 基于云模型的文本特征自動提取算法13.3.3 基于云概念躍升的文本分類13.4 本章小結(jié)參考文獻(xiàn)第14章 數(shù)據(jù)挖掘算法的云實現(xiàn)14.1 在云上實現(xiàn)數(shù)據(jù)挖掘算法的技術(shù)背景14.2 現(xiàn)有基于云計算的數(shù)據(jù)挖掘平臺14.2.1 “大云”系統(tǒng)14.2.2 Mahout開源項目14.2.3 電子科技大學(xué)與華為公司合作的云挖掘項目14.3 經(jīng)典數(shù)據(jù)挖掘算法的MapReduce實現(xiàn)思路14.4 經(jīng)典數(shù)據(jù)挖掘算法在Hadoop平臺的實現(xiàn)范例14.4.1 協(xié)同過濾算法在Hadoop平臺的實現(xiàn)14.4.2 樸素貝葉斯算法在Hadoop平臺的實現(xiàn)14.5 云挖掘技術(shù)的展望14.5.1 針對Web信息的云挖掘14.5.2 針對圖結(jié)構(gòu)的云挖掘14.5.3 針對聲音與視頻等多媒體信息的云挖掘參考文獻(xiàn)
章節(jié)摘錄
版權(quán)頁: 插圖: 13.3.2 基于云模型的文本特征自動提取算法 在傳統(tǒng)數(shù)據(jù)挖掘中,只能對結(jié)構(gòu)化的數(shù)據(jù)信息進(jìn)行處理,能夠處理的特征項也較少。而對于非結(jié)構(gòu)化文本信息則處理困難,這主要是由于文本特征向量的高維性造成的?;诖耍谋镜奶卣鞅硎境蔀槲谋就诰蛎媾R的首要任務(wù)。一個合理的文本特征表示方法具有以下兩個特征:一方面需要包含足夠的信息量,文本信息的關(guān)鍵特征不能丟失太多;另一方面,文本特征項也不能過多,否則會嚴(yán)重影響挖掘算法性能。出于這兩方面的考慮,產(chǎn)生了文本特征的選擇。 如何選擇適當(dāng)?shù)奶卣骷俏谋就诰蛑幸粋€十分重要的問題。過大或過小的特征空間都會嚴(yán)重影響到文本挖掘性能。一個有效的文本特征集合必須滿足文本內(nèi)容表示完整、較強(qiáng)的文本區(qū)分能力與保證盡量小的特征維度特點[10—12]。 目前,一般采用領(lǐng)域?qū)<业慕?jīng)驗知識來進(jìn)行特征集大小的設(shè)定,主要有直接據(jù)經(jīng)驗設(shè)定特征數(shù)(PFC)、按特征比例設(shè)定(THR)、通過統(tǒng)計量(MVS)或向量的空間稀疏性(SPA)等選擇方法[13—15]。 通過實際應(yīng)用測試,在特定語料庫上這些方法較好地解決了特征集空間的大小問題,但缺少理論基礎(chǔ)支撐,往往具有較強(qiáng)的主觀因素充斥其中。當(dāng)語料庫改變或有所調(diào)整時,需重新進(jìn)行設(shè)定,對于大規(guī)模的自動分類聚類將不再適用。綜上所述,若能找到一種具有較強(qiáng)數(shù)據(jù)適應(yīng)能力,能夠進(jìn)行文本特征自動提取的方法,將極大促進(jìn)文本挖掘的研究進(jìn)展。 1.文本特征提取概述 從理論上來說,特征項越多越能更好地進(jìn)行表示。但大量實踐顯示,事實并非總是如此。過大的特征空間將導(dǎo)致TM時間空間復(fù)雜度激增,計算代價更為高昂。隨著Internet的廣泛深入與信息資源的日益增加,尋求一種高性能的文本特征提取算法在TM中將變得越來越重要。 定義13—4 特征提取。特征提?。╢eature selection,F(xiàn)S)是選擇描述目標(biāo)的最佳特征子集的過程,得到的特征子集包含于原始特征集。即F′—F,其中F是原始特征集,F(xiàn)′是選擇后的特征子集。FS不僅能提高文本挖掘算法的運(yùn)行速度,降低占用的內(nèi)存空間;另一方面由于去掉了不相關(guān)或相關(guān)程度低的特征,可提高許多TM任務(wù)的性能,如文本分類的分類質(zhì)量等。
編輯推薦
《云模型與粒計算》覆蓋了所有有關(guān)粒度的理論、方法和技術(shù),是研究復(fù)雜問題求解、海量數(shù)據(jù)挖掘和模糊信息處理等問題的有力工具。《云模型與粒計算》可供計算機(jī)、自動化等相關(guān)專業(yè)的研究人員、教師、研究生、高年級本科生和工程技術(shù)人員參考。
圖書封面
評論、評分、閱讀與下載