漢語(yǔ)虛詞知識(shí)庫(kù)的建設(shè)

出版時(shí)間:2009-5  出版社:華中師范大學(xué)出版社  作者:劉云  頁(yè)數(shù):324  
Tag標(biāo)簽:無(wú)  

前言

  隨著歷史的發(fā)展,社會(huì)的進(jìn)步,科技的發(fā)達(dá),語(yǔ)言學(xué)在整個(gè)世界范圍內(nèi)越來(lái)越展示出強(qiáng)大的活力和能量。中國(guó)語(yǔ)言學(xué)是世界語(yǔ)言學(xué)的重要組成部分。為了對(duì)中國(guó)語(yǔ)言學(xué)事業(yè)有所推動(dòng),我們組織撰寫(xiě)“華中語(yǔ)學(xué)論庫(kù)”。作為專(zhuān)用名稱(chēng),這里的“語(yǔ)學(xué)”主要指漢語(yǔ)語(yǔ)言學(xué),近期的15年時(shí)間里以現(xiàn)代漢語(yǔ)語(yǔ)法專(zhuān)題研究為重點(diǎn)?!罢Z(yǔ)學(xué)論庫(kù)”,這是漢語(yǔ)語(yǔ)言學(xué)研究的一個(gè)系統(tǒng)工程,如果將來(lái)主客觀條件具備,在研究范圍上可以不斷擴(kuò)大,在研究時(shí)間上可以無(wú)限延展,在研究隊(duì)伍上可以輩輩交接,代代傳承?!叭A中”一詞,既跟研究隊(duì)伍的華中群體相關(guān),又跟華中師范大學(xué)出版社的名稱(chēng)相關(guān)?! h語(yǔ)語(yǔ)言學(xué)源遠(yuǎn)流長(zhǎng)。千百年來(lái),特別是《馬氏文通》出版以來(lái),尤其是20世紀(jì)70年代之后,由于一代代學(xué)者的不懈努力,漢語(yǔ)語(yǔ)言學(xué)沿著“創(chuàng)業(yè)——拓新——發(fā)展”的軌道不斷推進(jìn)。目前,漢語(yǔ)語(yǔ)言學(xué)所統(tǒng)括的漢語(yǔ)語(yǔ)法學(xué)、漢語(yǔ)語(yǔ)音學(xué)、漢語(yǔ)方言學(xué)、漢語(yǔ)詞匯學(xué)、漢語(yǔ)語(yǔ)用學(xué)等等學(xué)科,都已出現(xiàn)了初步繁榮的喜人局面。

內(nèi)容概要

  《漢語(yǔ)虛詞知識(shí)庫(kù)的建設(shè)》共分五章。第一章“面向信息處理的語(yǔ)言研究”主要介紹了中文信息處理的發(fā)展與成就、漢語(yǔ)自動(dòng)分析的難點(diǎn)、計(jì)算機(jī)背景下的漢語(yǔ)語(yǔ)法研究以及“句管控”與漢語(yǔ)信息處理等內(nèi)容。第二章“虛詞知識(shí)庫(kù)的建設(shè)”主要介紹了虛詞與虛詞研究概貌、漢語(yǔ)虛詞知識(shí)庫(kù)的重要性、虛詞知識(shí)庫(kù)建設(shè)的難點(diǎn)以及虛詞知識(shí)庫(kù)建設(shè)的構(gòu)想等內(nèi)容。第三章“虛詞詞典的內(nèi)容”主要介紹了副詞機(jī)器詞典、連詞機(jī)器詞典和介詞機(jī)器詞典等內(nèi)容。第四章“復(fù)句層次和關(guān)系的自動(dòng)分析”主要介紹了復(fù)句自動(dòng)分析的目標(biāo)和意義、難點(diǎn)和對(duì)策、二重復(fù)句的自動(dòng)分析、復(fù)句關(guān)系詞語(yǔ)的離析度以及關(guān)系詞語(yǔ)驅(qū)動(dòng)的復(fù)句關(guān)系和層次自動(dòng)判定。第五章是全書(shū)的結(jié)語(yǔ),主要是對(duì)已有研究工作的總結(jié)和進(jìn)一步的研究計(jì)劃。

書(shū)籍目錄

序前言第一章 面向信息處理的語(yǔ)言研究第一節(jié) 中文信息處理的發(fā)展與成就一、引言二、中文信息處理的發(fā)展三、中文信息處理的成就第二節(jié) 漢語(yǔ)自動(dòng)分析的難點(diǎn)一、引言二、詞法分析的難點(diǎn)三、句法分析的難點(diǎn)四、轉(zhuǎn)換過(guò)程的難點(diǎn)五、小結(jié)第三節(jié) 計(jì)算機(jī)背景下的漢語(yǔ)語(yǔ)法研究一、研究對(duì)象的轉(zhuǎn)換二、研究目的的轉(zhuǎn)換三、研究手段的轉(zhuǎn)換四、研究視角的轉(zhuǎn)換五、小結(jié)第四節(jié) “句管控”與漢語(yǔ)信息處理一、引言二、詞語(yǔ)切分與詞性標(biāo)注三、句法與語(yǔ)義四、理論與實(shí)踐五、小結(jié)第二章 虛詞知識(shí)庫(kù)的建設(shè)第一節(jié) 虛詞與虛詞研究一、虛詞概貌及其作用二、虛詞在通用語(yǔ)料庫(kù)中的使用情況三、虛詞研究第二節(jié) 漢語(yǔ)虛詞知識(shí)庫(kù)的重要性一、詞法分析中的作用二、句法分析中的作用三、具體應(yīng)用中的作用第三節(jié) 虛詞知識(shí)庫(kù)建設(shè)的難點(diǎn)一、虛詞語(yǔ)法意義的概括二、虛詞用法差異的揭示第四節(jié) 虛詞知識(shí)庫(kù)的建設(shè)一、引言二、“三位一體”的虛詞知識(shí)庫(kù)建設(shè)三、小結(jié)第三章 虛詞詞典的內(nèi)容第一節(jié) 副詞機(jī)器詞典一、副詞及其分類(lèi)二、副詞字段的設(shè)立三、副詞目錄四、副詞機(jī)器詞典摘錄第二節(jié) 連詞機(jī)器詞典一、連詞及其研究二、連詞字段的設(shè)立三、連詞目錄四、連詞機(jī)器詞典摘錄第三節(jié) 介詞機(jī)器詞典一、介詞及其分類(lèi)二、介詞字段的設(shè)立三、介詞目錄四、介詞機(jī)器詞典摘錄第四章 復(fù)句層次和關(guān)系的自動(dòng)分析第一節(jié) 復(fù)句關(guān)系和層次自動(dòng)分析的目標(biāo)和意義一、漢語(yǔ)復(fù)句自動(dòng)分析的目標(biāo)二、復(fù)句自動(dòng)分析的意義第二節(jié) 漢語(yǔ)復(fù)句自動(dòng)分析的難點(diǎn)與對(duì)策一、復(fù)句自動(dòng)分析的難點(diǎn)二、復(fù)句自動(dòng)分析的策略三、單復(fù)句的確認(rèn)對(duì)策第三節(jié) 二重復(fù)句自動(dòng)劃分研究一、引言二、復(fù)句關(guān)系詞語(yǔ)的包孕機(jī)制三、小結(jié)第四節(jié) 復(fù)句關(guān)系詞語(yǔ)離析度一、引言二、復(fù)句關(guān)系詞語(yǔ)的離析度三、復(fù)句關(guān)系詞語(yǔ)離析能力差異分析第五節(jié) 關(guān)系詞語(yǔ)驅(qū)動(dòng)的復(fù)句關(guān)系和層次自動(dòng)判定一、引言二、復(fù)句關(guān)系詞語(yǔ)的作用三、復(fù)句關(guān)系詞語(yǔ)的表現(xiàn)四、復(fù)句自動(dòng)分析的流程第五章 結(jié)語(yǔ)第一節(jié) 研究工作回眸第二節(jié) 研究工作設(shè)想附錄1 復(fù)句層次和關(guān)系標(biāo)注語(yǔ)料庫(kù)樣例及說(shuō)明附錄2 復(fù)句層次和關(guān)系自動(dòng)分析系統(tǒng)后記

章節(jié)摘錄

  1991年,北京語(yǔ)言學(xué)院漢語(yǔ)水平考試中心組成研制小組,以國(guó)內(nèi)影響較大的七個(gè)動(dòng)態(tài)性頻度統(tǒng)計(jì)詞典、詞表和字表為主要依據(jù),編制了《漢語(yǔ)水平詞匯與漢字等級(jí)大綱》。其編制總原則為:(1)多學(xué)科定量統(tǒng)計(jì)與群體性定性分析相結(jié)合;(2)語(yǔ)言學(xué)科學(xué)原財(cái)與對(duì)外漢語(yǔ)教學(xué)需要相結(jié)合。共得常用詞8822個(gè),分成甲、乙、丙、丁四級(jí),寫(xiě)進(jìn)《大綱》(修訂稿)。這是一次較為典型的把主、客觀標(biāo)準(zhǔn)有機(jī)結(jié)合起來(lái)選擇漢語(yǔ)常用詞的實(shí)踐?! ∮捎?0世紀(jì)90年代初期有多個(gè)常用字詞統(tǒng)計(jì)結(jié)果的推出,隨后常用字詞的統(tǒng)計(jì)相對(duì)沉寂了幾年。隨著網(wǎng)絡(luò)等媒體的興盛,大規(guī)模字詞統(tǒng)計(jì)又開(kāi)始復(fù)興。進(jìn)入21世紀(jì)后,先后有兩次大規(guī)模的詞匯統(tǒng)計(jì),分別是《中國(guó)語(yǔ)言生活狀況報(bào)告(2005)》和《中國(guó)語(yǔ)言生活狀況報(bào)告(2006)》。這兩次調(diào)查統(tǒng)計(jì)有三個(gè)重要的特點(diǎn):一是規(guī)模大?!吨袊?guó)語(yǔ)言生活狀況報(bào)告(2005)》調(diào)查語(yǔ)料分為平面媒體、有聲媒體、網(wǎng)絡(luò)媒體三種,共計(jì)892034個(gè)文本文件,909429700字符次,其中漢字出現(xiàn)732143010字次。《中國(guó)語(yǔ)言生活狀況報(bào)告(2006)》調(diào)查的語(yǔ)料分為平面媒體、有聲媒體、網(wǎng)絡(luò)媒體三種,共計(jì)1311749個(gè)文本文件,1170367879字符次,其中漢字出現(xiàn)978994406字次,規(guī)模達(dá)10億次,這是迄今為止最大規(guī)模的漢語(yǔ)字詞統(tǒng)計(jì)。二是統(tǒng)計(jì)項(xiàng)目全面。兩次調(diào)查的主要對(duì)象是漢字和詞語(yǔ),調(diào)查項(xiàng)目有“頻次、頻率、累加頻率、出現(xiàn)文本數(shù)”等。三是成果豐碩。

圖書(shū)封面

圖書(shū)標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    漢語(yǔ)虛詞知識(shí)庫(kù)的建設(shè) PDF格式下載


用戶(hù)評(píng)論 (總計(jì)0條)

 
 

 

250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7