出版時間:2010-4 出版社:廈門大學(xué)出版社 作者:鄭澤芝 頁數(shù):295
Tag標(biāo)簽:無
前言
鄭澤芝博士的專著《大規(guī)模真實文本漢語字母詞語考察研究》是她在博士論文的基礎(chǔ)上修改增訂而成的,她于2005年畢業(yè)獲博士學(xué)住,而本書在她畢業(yè)四年之后才提上出版日程,2005年后她又在《語言文字應(yīng)用》、《中文信息學(xué)報》、《語言科學(xué)》、《廈門大學(xué)學(xué)報》等學(xué)術(shù)期刊和“中國語言學(xué)會”、“中國社會語言學(xué)國際會議”、“漢語和漢字關(guān)系國際會議”等學(xué)術(shù)會議上陸續(xù)報告了多篇相關(guān)論文。從2004年到2009年,她共發(fā)表了近20篇有關(guān)字母詞語的研究論文,在她讀博期間,字母詞語研究就得到國家語言資源監(jiān)測與研究中心項目“中國主流報紙大規(guī)模真實文本字母詞語考察”的支持,畢業(yè)后她到廈門大學(xué)工作,又繼續(xù)申請了福建省社科規(guī)劃項目“基于大規(guī)模真實文本的漢語字母詞語分類考察研究”以及廈門大學(xué)科研啟動基金的資助?! 〈_定研究目標(biāo)之后,“咬定青山不放松”,持之以恒。她不急于出書,而是先發(fā)表階段性成果,既有先發(fā)優(yōu)勢,也得以在深入觀察研究分析之后再系統(tǒng)全面論述,這是澤芝的研究特點之一。 她搶占先機(jī)抓緊不放的這個特點,我還有一個小故事作佐證: 2003年10月初,我去國家語委參加關(guān)于“字母詞”的討論會,澤芝的字母詞研究還處在收集材料和預(yù)研階段(所以她在《后記》中說她對字母詞語的研究“始于2004年”)。離開會還有一兩天時間,我問她:“你能不能給我一些最基本的統(tǒng)計數(shù)據(jù)?比如到底在我們的報紙上字母詞語的實際使用情況是多少?《人民日報》上是多少?《北京青年報》又是多少?
內(nèi)容概要
漢語中字母詞語的使用情況已經(jīng)無法僅僅用外來語來涵蓋,比如:HSK、GB、3C、阿Q等。而且這種語言現(xiàn)象在漢語中的使用,呈泛濫的態(tài)勢,有的字母串已經(jīng)產(chǎn)生了很強(qiáng)的構(gòu)詞語能力,字母參與構(gòu)詞也已屢見不鮮,它們已經(jīng)是漢語中不容忽視的一種新語言現(xiàn)象。它們的影響還不僅限于此,對于漢語信息處理而言,字母詞語不僅是漢語中的一類新詞語,而且其中含有大量的各領(lǐng)域術(shù)語,其中許多術(shù)語正在進(jìn)入漢語語言社會的各個層面,它們已經(jīng)成了情報翻譯、自動分詞、信息檢索、機(jī)器翻譯中不可低估的影響因素?! ≌Z言學(xué)界見仁見智,態(tài)度各異,有人主張保衛(wèi)祖國語言的純潔性,有人為字母詞語叫好。本書認(rèn)為字母詞語在漢語中的使用不是孤立的,只有經(jīng)過大規(guī)模真實文本的考察,才可以用事實說話,并據(jù)實給予規(guī)范和制定相關(guān)的政策?! ”緯捎谜Z料庫技術(shù)與內(nèi)省相結(jié)合、定量和定性相結(jié)合的研究方法,以大規(guī)模真實文本為研究基礎(chǔ),歷時5年,跟蹤考察了近兩億真實文本語料。界定了文字字母;對字母詞語所用字符進(jìn)行了考察和歸納,界定了字母詞語;在共時截面上對字母詞語在主流報紙媒體的使用狀況進(jìn)行了全面客觀的描述和分析;對字母詞語的主題領(lǐng)域分布、用法分布狀況進(jìn)行了量化分析研究;從不同角度對字母詞語分類、構(gòu)成成分進(jìn)行了研究;從歷時發(fā)展的角度對字母詞語演化狀況進(jìn)行了跟蹤研究;從語言信息處理的角度對字母詞語的統(tǒng)計特征和字母詞語的自動識別進(jìn)行了研究;對通用字母詞語的量化提取進(jìn)行了探索;對字母詞語將給漢語文字系統(tǒng)帶來怎樣的影響進(jìn)行了探索等等??陀^真實地描寫和分析了字母詞語的各種情況,取得了大量第一手的資料。全書共分15章,書后附有作者整理的字母詞語研究文獻(xiàn)索引錄,雙語對釋字母詞語表,5年歷時字母詞語表,《人民日報》、《北京青年報》、《羊城晚報》共有字母詞語表等附錄?! ”緯鴮ι鐣Z言學(xué)、漢語詞匯學(xué)、新詞語、外來語的研究有重要的參考價值,是中文信息處理領(lǐng)域的人員和相關(guān)單位關(guān)注的對象,同時也可為政府有關(guān)部門制訂相關(guān)政策提供參考。
書籍目錄
序/張普第一章 緒論1 字母詞語的界定2 字母詞語與真實文本3 本書的結(jié)構(gòu)第二章 主流報紙媒體字母詞語的使用狀況1 語料的選擇2 文本中使用的非漢字符3 外文字母在漢語文本中的使用情況4 媒體字母詞語的量化概況5 各報紙媒體字母詞語概況5.1 《人民日報》字母詞語概況5.2 《北京青年報》字母詞語概況5.3 《羊城晚報》字母詞語概況6 媒體字母詞語的一次性使用情況7 不同性質(zhì)媒體中字母詞語的使用情況8 媒體共有字母詞語情況9 小結(jié)第三章 字母詞語中的標(biāo)點1 字母詞語中的標(biāo)點符號2 字母詞語中標(biāo)點符號出現(xiàn)情況及問題2.1 字母詞語中標(biāo)點的出現(xiàn)情況2.2 與標(biāo)點相關(guān)問題的處理3 小結(jié)第四章 字母詞語中的數(shù)字1 數(shù)字在字母前的情形2 數(shù)字在字母后的情形3 含數(shù)字字母詞語之管見第五章 單字母、多字母、光桿字母詞語與字母詞語并列結(jié)構(gòu)1 單字母字母詞語2 多字母字母詞語考察3 光桿字母詞語與外語原文縮略語3.1 光桿字母詞語使用狀況3.2 字母詞語原文縮略和漢語拼音成詞問題4 字母詞語的并列結(jié)構(gòu)第六章 雙語對釋字母詞語1 雙語對釋字母詞語在文本中的使用情況概述2 對釋漢字串的分布考察3 雙語對釋字母詞語語形歷時演化分析4 雙語對釋字母詞語使用方式演化4.1 共有雙語對釋字母詞語I型、Ⅱ型分布4.2 雙語對釋全稱簡稱形式的演化4.3 字母詞語中的新詞語5 小結(jié)第七章 字母詞語領(lǐng)域分布特點1 媒體主題領(lǐng)域聚類2 字母詞語在各主題領(lǐng)域的量化分布規(guī)律2.1 一般字母詞語領(lǐng)域分布情況2.2 雙語對釋字母詞語領(lǐng)域分布情況3 領(lǐng)域共有字母詞語的情況分析4 各主題域獨有字母詞語情況分析5 小結(jié)第八章 字母詞語有多少種用法1 字母詞語的用法分類2 字母詞語的用法分布情況3 字母詞語領(lǐng)域和用法交叉分布情況4 小結(jié)第九章 字母詞語的演化態(tài)勢1 字母詞語的使用數(shù)量的歷時演化2 字母詞語一次性使用的歷時變化3 字母詞語變化程度及變化趨勢4 一般字母詞語的演化情況分析4.1 數(shù)量變化4.2 字母詞語搭配漢字的情況4.3 共有一般詞語的分類考察5 字母詞語穩(wěn)定性第十章 字母詞語的使用與規(guī)范1 字母詞語的層次劃分1.1 字母詞語三圈劃分1.2 外語原詞、計算機(jī)相關(guān)詞語在文本中的使用情況2 字母詞語來源分析3 外文字母使用例析4 字母詞語不規(guī)范情況分類5 字母詞語的詞性問題6 字母詞語的歸化7 關(guān)于字母詞語的幾點建議第十一章 字母詞語對漢語文字系統(tǒng)的影響1 語言與文字2 從外來語到字母詞語2.1 傳統(tǒng)外來語的影響2.2 字母詞語與漢語言系統(tǒng)3 漢語文字系統(tǒng)4 漢字系統(tǒng)可否發(fā)生變化5 小結(jié)第十二章 通用字母詞語提取研究1 通用詞語的各種量化屬性2 字母詞語量化屬性觀察分析3 通用字母詞語提取算法3.1 絕對指標(biāo)提取方法3.2 通用度方法3.3 散布均勻度方法……第十三章 字母詞語的自動識別第十四章 字母詞語的社會接受程度考察第十五章 結(jié)束語附錄后記
章節(jié)摘錄
面的、口頭的、日常生活中街市門面、各種標(biāo)牌的……語言的使用涉及生活的方方面面,邊邊角角,各個層面,各個年齡段。我們只是從一個側(cè)面考察了字母詞語的使用情況,雖說一滴水可以折射大海,但畢竟客觀實際中還存在大量應(yīng)該但卻沒有被反映的現(xiàn)實。如果可以,我們應(yīng)該從更多的途徑考察更多的媒體中外文字母的使用情況,以便更全面地反映外文字母在漢語中的使用狀況?! ∽詣犹崛『腿斯ばΦ慕Y(jié)果不可謂不豐富,十幾萬條次的工程字母詞語,足以產(chǎn)生一些很有價值的結(jié)論,但因投入的時間、人力、物力等原因,我們目前不可能對它們一一標(biāo)記語義、領(lǐng)域、結(jié)構(gòu)、語法等屬性以供后人更好地研究它們,或為國家語言生活提供更好的參考。面對如此大量的條目進(jìn)行人工歸類分析,工程非常巨大,我們認(rèn)為必須對計算機(jī)輔助字母詞語自動聚類進(jìn)行研究,以減少人工投入;工程中還存在語言學(xué)需要解決的問題、各領(lǐng)域術(shù)語的映射問題,如:語言學(xué)對專名描述就不夠精細(xì),拿來說事時往往捉襟見肘;語言學(xué)的專名與語言信息處理學(xué)界的命名實體之間是一種什么樣的關(guān)系,我們弄不清楚或者就沒有想去弄清楚,這一點也反映出語言學(xué)和語言信息處理研究上缺乏溝通和互補(bǔ)。因而,我們對《人民日報》的提取結(jié)果進(jìn)行的分類分析,也只是粗淺的、不太成熟的,但已經(jīng)可以初見字母詞語在漢語中使用狀況的端倪?! 】疾熘形覀儼l(fā)現(xiàn)字母詞語一次性出現(xiàn)的比率達(dá)到甚至超過了70%,這種現(xiàn)象引起了我們的注意,我們發(fā)現(xiàn)這種現(xiàn)象除了與字母詞語是新詞語、出現(xiàn)的次數(shù)低有關(guān)系外,也和它們多為產(chǎn)品名、公司名、各種術(shù)語協(xié)定名有關(guān)。這類對象只在各種專業(yè)或行業(yè)文本中高頻出現(xiàn)。還有一個更重要的原因就是字母詞語缺乏使用規(guī)范,造成字母詞語使用的混亂狀態(tài),同一個對象有多個不同的指稱,如“全國男籃甲A聯(lián)賽(CBA)”這個比較普通的字母詞語在文本中還有“全國男子籃球甲A聯(lián)賽(CBA)”這一孿生兄弟,所以對字母詞語結(jié)果進(jìn)行。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載
大規(guī)模真實文本漢語字母詞語考察研究 PDF格式下載