出版時間:2008-6 出版社:北京燕山出版社 作者:李榮,曹建芳
Tag標簽:無
內(nèi)容概要
《漢語名詞短語和動詞短語的自動識別方法研究》面向中文信息處理的實際需要,介紹了用規(guī)則方法識別漢語名詞短語和動詞短語的過程,然后介紹了用隱馬爾可夫模型識別漢語名詞短語,用支持向量機識別漢語動詞短語的過程。在此基礎上,探討了解決計算機分析漢語短語結構碰到的各類歧義問題的途徑。短語識別是中文信息處理領域的一個重要組成部分?!稘h語名詞短語和動詞短語的自動識別方法研究》可作為高等院校計算機專業(yè)高年級學生的教學參考書,也可供從事中文信息處理及人工智能研究的相關人員參考。
書籍目錄
第1章 引論
1.1 課題的提出
1.2 面向計算機的語言學研究工作的模式
1.3 開展本課題研究工作的基礎
1.3.1 研究意義
1.3.2 研究難點
1.3.3 國內(nèi)外研究動態(tài)
1.4 本書的結構安排
第2章 漢語的計算機理解
2.1 漢語的特點
2.2 漢語理解中的特殊問題
2.2.1 漢語句子的歧義切分問題
2.2.2 未登錄詞問題
2.2.3 謂語的組成問題
2.2.4 多動詞聯(lián)用問題
2.2.5 詞性歧義問題
2.2.6 主語和施事問題
2.2.7 否定詞和語義上的混論
2.2.8 形態(tài)變化問題
2.2.9 句子的詞序問題
2.2.10 漢語的特殊模式問題
2.2.11 漢語的歧義結構
2.3 小結
第3章 漢語短語的基本知識
3.1 漢語短語的標注體系
3.2 短語的組成定義
3.3 短語的句法功能分類框架
3.4 小結
第4章 基于規(guī)則的漢語短語識別
4.1漢語短語np、vp結構的統(tǒng)計與分析
4.1.1 漢語短語np的統(tǒng)計與分析
4.1.2 漢語短語vp的統(tǒng)計與分析
4.2 漢語短語np、vp識別的定界規(guī)則
4.2.1 獲取上下文規(guī)則的必要性
4.2.2 名詞短語np定界規(guī)則的確定
4.2.3 動詞短語vp定界規(guī)則的確定
4.2.4 上下文規(guī)則的獲取
4.3 漢語短語np、vp的句法語義分析
4.3.1 漢語短語11p的句法語義分析
4.3.2 漢語短語vp的句法語義分析
4.4 基于規(guī)則的漢語短語np、vp的自動識別
4.4.1 識別算法
4.4.2 實驗系統(tǒng)
4.4.3 實驗數(shù)據(jù)分析
4.5 小結
第5章 基于HMM的名詞短語識別
5.1 相關技術介紹
5.1.1 HMM簡介
5.1.2 層次分析法介紹
5.2 相關資源建設
5.2.1 資源建設方法
5.2.2 資源組成
5.2.3 資源建設
5.3 HMM模型的設計
5.3.1 HMM模型的建立
5.3.2 HMM模型的參數(shù)估計
5.3.3 NP識別過程
5.4 模型的實驗與結果分析
5.4.1 系統(tǒng)總體設計框圖
5.4.2 主要模塊的算法設計
5.4.3 總體算法流程圖
5.4.4 實驗結果與分析
5.5 小結
第6章 基于SVM的動詞短語識別
6.1 支持向量機介紹
6.1.1 引言
6.1.2 SVM簡介
6.2 現(xiàn)代漢語動詞短語相關知識介紹
6.2.1 動詞短語簡介及其分類
6.2.2 用于VP識別的詞語句法屬性集合的確定
6.2.3 語料選取
6.2.4 動詞短語最佳觀察窗口的確定
6.2.5 動詞短語的分析
6.3 動詞短語特征提取
6.3.1 靜態(tài)特征提取
6.3.2 動態(tài)特征提取
6.4 動詞短語向量空間模型的建立
6.5 基于SVM的動詞短語識別
6.5.1 構造SVM分類器
6.5.2 基于SVM的動詞短語識別
6.6 實驗模型及結果分析
6.6.1 子語料的形成
6.6.2 基于SVM的動詞短語識別方法實驗系統(tǒng)及結果分析
6.7 小結
第7章 短語結構歧義類型與消解策略分析
7.1 從計算機處理的角度看漢語短語結構歧義
7.2 包含終結符的歧義格式與不包含終結符的歧義格式
7.3 外顯型歧義格式與內(nèi)含型歧義格式
7.4 真歧義格式、準歧義格式、偽歧義格式
7.5 短語結構歧義的消解策略分析
7.5.1 短語結構歧義的消解策略概述
7.5.2 短語結構歧義的消解方法及舉例
7.6 小結
第8章 關于短語識別的評測問題
8.1 評測在軟件開發(fā)中的位置
8.1.1 引言
8.1.2 評測在軟件開發(fā)過程中的位置
8.1.3 ISO9126標準
8.2 評測模型的定義
8.2.1 評測中的主要概念——形式和自動化概述
8.2.2 參數(shù)化測試臺(PTB)
8.3 短語識別的評測框架及部分實現(xiàn)
8.3.1 屬性集
8.3.2 需求
8.3.3 方法
8.3.4 測量
8.3.5 翻譯評測的度量
8.3.6 評測過程
8.3.7 分詞與詞性標注自動評測系統(tǒng)
8.3.8 短語分析評測標準及其度量方式
8.3.9 測試結果提交格式
8.4 小結
第9章 結語
9.1 對本課題研究工作的總結
9.2 規(guī)則方法與統(tǒng)計方法的比較
9.3 進一步的研究計劃
附錄1 符號代碼說明
附錄2 《現(xiàn)代漢語語法信息詞典》動詞庫專有項目
附錄3 SMO算法的偽碼
附錄4 現(xiàn)代漢語短語結構歧義格式舉例
附錄5 測試句樣例
參考文獻
后記
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載