中文文本信息處理的原理與應(yīng)用

出版時間:2007-9  出版社:清華大學(xué)出版社  作者:苗奪謙,衛(wèi)志華 編著  頁數(shù):321  
Tag標(biāo)簽:無  

內(nèi)容概要

本書是一本全面系統(tǒng)地介紹中文文本信息處理的教材,內(nèi)容豐富,由淺入深地講述了中文文本信息處理的原理與應(yīng)用。本書不僅介紹了基于規(guī)則的自然語言分析方法,也介紹了基于統(tǒng)計(jì)學(xué)的方法。全書共分為四大部分,分別是詞法分析、語法處理、語義分析和應(yīng)用與技術(shù)。其中前三部分是自然語言處理的基本理論,第一部分針對中文處理中特有的分詞問題,介紹了自動分詞算法、分詞中歧義的消除和未登錄詞的識別算法,另外還介紹了語料庫的相關(guān)知識。第二部分和第三部分都是從語法(語義)的表示入手,將自然語言形式化,再給出語法(語義)分析的算法,并針對該過程中的歧義問題給出了一些成熟的解決方案。最后一部分講述自然語言理解在信息檢索、信息抽取、自動文摘和文本分類等領(lǐng)域的應(yīng)用。本書思路清晰,在每部分及每章的開始都介紹了該部分知識與其他部分之間的關(guān)系,以及該部分的知識點(diǎn)之間的關(guān)系,以幫助讀者從整體上把握中文文本信息處理的思路,并能根據(jù)不同的需求或不同的問題選擇適當(dāng)?shù)乃惴??! ”緯婕皟?nèi)容廣泛,能滿足不同水平讀者群的需求,可以作為計(jì)算機(jī)、信息類高年級本科生的教材,也可作為自然語言處理方向研究生的教材,也非常適合作為自然語言處理應(yīng)用領(lǐng)域的研究人員和技術(shù)人員的參考資料。

書籍目錄

第1章 概論 1.1 自然語言處理與中文信息處理 1.2 自然語言處理的新趨勢 1.3 本書內(nèi)容組織第一部分 詞法分析 第2章 自動分詞  2.1 關(guān)于自動分詞  2.2 分詞詞典  2.3 機(jī)械分詞方法 第3章 分詞歧義消解  3.1 關(guān)于分詞歧義  3.2 基于規(guī)則的分詞消歧  3.3 基于統(tǒng)計(jì)方法的分詞消歧 第4章 未登錄詞獲取  4.1 關(guān)于未登錄詞  4.2 基于統(tǒng)計(jì)學(xué)的未登錄詞獲取方法  4.3 中文姓名的自動辨識  4.4 中文統(tǒng)計(jì)詞匯獲取  4.5 無詞典分詞方法 第5章 語料庫的構(gòu)建  5.1 關(guān)于語料庫  5.2 漢語語料庫的基本加工規(guī)范  5.3 建設(shè)語料庫的其他問題 第一部分習(xí)題第二部分 語法處理 第6章 自動標(biāo)注  6.1 關(guān)于自動標(biāo)注  6.2 馬爾可夫模型和隱馬爾可夫模型  6.3 馬爾可夫模型標(biāo)注器    6.4 隱馬爾可夫模型標(biāo)注器 第7章 語法表示  7.1 關(guān)于語法表示  7.2 形式語法描述  7.3 短語結(jié)構(gòu)語法  7.4 轉(zhuǎn)移網(wǎng)絡(luò)  7.5 短語結(jié)構(gòu)與句法樹 第8章 語法分析  8.1 關(guān)于語法分析  8.2 基于符號串的句法分析  8.3 自底向上的圖句法分析  8.4 自頂向下的圖句法分析  8.5 基于轉(zhuǎn)移網(wǎng)絡(luò)的句法分析  8.6 移進(jìn)歸約句法分析器  8.7 概率上下文無關(guān)文法分析 第二部分習(xí)題第三部分 語義分析 第9章 語義表示  9.1 關(guān)于語義表示  9.2 語義的邏輯表示方法  9.3 論旨角色  9.4 語義網(wǎng)絡(luò)表示法  9.5 框架表示法  9.6 量詞的處理 第10章 語義分析  10.1 關(guān)于語義分析  10.2 組合理論與語義解釋  10.3 基于語義特征的解釋方法  10.4 基于語法關(guān)系的語義分析  10.5 語義語法  10.6 模板匹配  10.7 語義驅(qū)動的分析技術(shù) 第11章 語義消歧  11.1 關(guān)于語義歧義   11.2 選擇限制法消歧  11.3 語義網(wǎng)絡(luò)  11.4 統(tǒng)計(jì)詞義消歧  11.5 統(tǒng)計(jì)語義優(yōu)選 第三部分習(xí)題第四部分 應(yīng)用與技術(shù) 第12章 文本分類  12.1 關(guān)于文本分類  12.2 文本分類方法  12.3 文本分類的評測 第13章 信息檢索  13.1 關(guān)于信息檢索  13.2 基于統(tǒng)計(jì)學(xué)的信息檢索模型  13.3 基于語義的信息檢索  13.4 典型信息檢索系統(tǒng)  13.5 信息檢索技術(shù)前沿 第14章 信息抽取  14.1 關(guān)于信息抽取  14.2 半結(jié)構(gòu)化文本的信息抽取技術(shù)  14.3 典型信息抽取系統(tǒng)  14.4 Web信息抽取 第15章 自動文摘  15.1 關(guān)于自動文摘  15.2 自動文摘的方法  15.3 自動文摘系統(tǒng)的評測  15.4 自動文摘系統(tǒng) 第四部分習(xí)題參考文獻(xiàn)

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    中文文本信息處理的原理與應(yīng)用 PDF格式下載


用戶評論 (總計(jì)13條)

 
 

  •   這本書寫的不錯,我已看過多次了,適合自然語言初學(xué)者的確是本好書。
  •   這本書很適合信息管理、情報學(xué)專業(yè)同學(xué)好好學(xué)習(xí)的。
  •   本書難度不小,適合有時間鉆研的朋友。
  •   不錯 是很新 是正版吧 反正和我們老師用的一模一樣
  •   抄也就算了,抄了也不好好組織一下!
  •   由于市場上這類書比較少,所以可以說開卷有益吧!書還是有點(diǎn)偏理論,對于像我這樣沒有基礎(chǔ)的學(xué)習(xí)者挺合適的。
  •   很水的一本書,還不如買本《統(tǒng)計(jì)自然語言處理基礎(chǔ)》來看看
  •   還沒來得及細(xì)看,粗粗翻了一下,還不錯
  •   這本書的作者我認(rèn)識,同濟(jì)計(jì)算機(jī)系的一位知名教授.可是書中大段大段抄襲別人的內(nèi)容,讓讀者很不爽.如果沒有中文文本處理/自然語言處理基礎(chǔ)的讀者可以買一本看看.
  •   介紹了各種方法,沒有深入研究
  •   信息處理方面很不錯的教材
  •   這本書還可以,講解較為全面,作為入門教材比較可以。
  •   介紹的太范,太淺
 

250萬本中文圖書簡介、評論、評分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號-7