漢英平行語料庫的平行處理

出版時間:2011-11  出版社:世界圖書出版公司  作者:馮敏萱 著  頁數(shù):224  
Tag標簽:無  

內(nèi)容概要

  漢英語料的平行處理技術(shù),旨在利用雙語信息以解決歧義現(xiàn)象。本課題研究了漢英平行語料中的未登錄詞識別、詞性標注、詞義標注及句法分析等層面的平行處理技術(shù)及其有效性,實現(xiàn)了漢一英雙向平行處理。在詞匯未對齊平行語料中,采用了基于個性規(guī)則的詞性、詞義消歧方法。精加工1000句對的漢英平行語料,可作為加工大規(guī)模平行語料的資源。平行處理技術(shù)可以有效解決單語處理時的一系列困難,有助于漢英機器翻譯知識的自動獲取。

作者簡介

  馮敏萱,江蘇南京人。語言學(xué)及應(yīng)用語言學(xué)專業(yè)文學(xué)博士?,F(xiàn)任南京師范大學(xué)文學(xué)院語言科技系講師,獲校第八屆青年教師教學(xué)大賽“教學(xué)十佳”稱號。主要研究方向為中文信息處理、語料庫語言學(xué)。發(fā)表論文20篇,代表作有《帶后綴“者”的派生詞識別》、《英語人名的漢譯名平行識別》和Parallel
Processing Strategy for Segmentation
Ambiguity?,F(xiàn)主持江蘇省社會科學(xué)基金項目1項,參與國家社會科學(xué)基金項目等4項。

書籍目錄

第一章 引言
 第一節(jié) 平行語料庫的現(xiàn)狀
 第二節(jié) 本課題的研究意義及價值
 第三節(jié) 本課題的研究內(nèi)容及方法
第二章 平行語料庫概述
 第一節(jié) 平行語料庫的建設(shè)與發(fā)展
 第二節(jié) 平行語料庫的加工與利用
 第三節(jié) 平行語料庫與其他相關(guān)研究
 第四節(jié) 本章小結(jié)
第三章 詞匯分析的平行處理
 第一節(jié) 詞匯分析研究的現(xiàn)狀及難點
 第二節(jié) 平行處理實驗的設(shè)計
 第三節(jié) 平行處理實驗結(jié)果的分析
 第四節(jié) 本章小結(jié)
第四章 詞性標注的平行處理
 第一節(jié) 詞性標注研究的現(xiàn)狀及難點
 第二節(jié) 平行處理實驗的設(shè)計
 第三節(jié) 平行處理實驗結(jié)果的分析
 第四節(jié) 本章小結(jié)
第五章 詞義標注的平行處理
 第一節(jié) 詞義標注研究的現(xiàn)狀及難點
 第二節(jié) 平行處理實驗的設(shè)計
 第三節(jié) 平行處理實驗結(jié)果的分析
 第四節(jié) 本章小結(jié)
第六章 句法結(jié)構(gòu)的平行處理
 第一節(jié) 句法結(jié)構(gòu)研究的現(xiàn)狀及難點
 第二節(jié) 平行處理實驗的設(shè)計
 第三節(jié) 平行處理實驗結(jié)果的分析
 第四節(jié) 本章小結(jié)
結(jié)語
參考文獻
附錄
附錄一 PCCE1000觀察語料示例
附錄二 PCCE1000統(tǒng)計數(shù)據(jù)總表
附錄三 術(shù)語索引
附錄四圖表索引
后記

章節(jié)摘錄

  機器翻譯的實質(zhì)在于輸入的源語與目標語通過后臺平行語料庫建立對應(yīng)關(guān)系,包括詞匯和結(jié)構(gòu)的對應(yīng)。從這個角度看,決定機器翻譯質(zhì)量最重要的兩個因素是:一、后臺語料庫內(nèi)容的豐富與否。簡單地說,就是語料庫里有沒有源語與目標語的對應(yīng),這將決定機器能否順利翻譯。二、在后臺的若干對應(yīng)中,能不能選擇出合適的對應(yīng),這個因素決定了翻譯是否正確、到位。因此,從原理上來講,應(yīng)該建立大型的雙語平行語料庫,使得需要翻譯的句子在語料庫中能夠檢索到相同或相近的句子并自動生成翻譯產(chǎn)品或翻譯的粗產(chǎn)品(余國良,2009)?! ≡谶@方面,已經(jīng)有學(xué)者開始考慮同時利用兩種語言的信息來進行研究,穗志方等(1998)提出,基于實例的漢英機器翻譯系統(tǒng),應(yīng)該在比較兩句整體結(jié)構(gòu)相似的基礎(chǔ)上進行語句相似度計算,除了利用骨架依存分析法,識別漢語謂詞中心詞,還根據(jù)漢英例句集中英語例句的謂語中心詞來識別相應(yīng)的漢語例句的謂語中心詞,實驗對3000個漢語單句進行謂語中心詞的自動識別,正確率達到87.3%。  但是,隨著研究的深入,人們發(fā)現(xiàn)基于平行語料庫的翻譯信息獲取,對于機器翻譯等有以下的不足:(1)獲取的翻譯信息的質(zhì)量一定程度上依賴于平行語料的質(zhì)量,即譯文的質(zhì)量;(2)新出現(xiàn)的詞往往超前于平行語料庫,從平行語料庫中難以獲取新詞及其譯詞,而對于新詞(未登錄詞)的處理能力對機器翻譯卻十分重要,尤其在專業(yè)領(lǐng)域,單詞術(shù)語和多詞術(shù)語的獲取對機器翻譯尤其重要?!  ?/pre>

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    漢英平行語料庫的平行處理 PDF格式下載


用戶評論 (總計1條)

 
 

  •   希望比較實用.
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7