漢英統(tǒng)計(jì)學(xué)術(shù)語建庫探索與思考_第1頁
漢英統(tǒng)計(jì)學(xué)術(shù)語建庫探索與思考_第2頁
漢英統(tǒng)計(jì)學(xué)術(shù)語建庫探索與思考_第3頁
漢英統(tǒng)計(jì)學(xué)術(shù)語建庫探索與思考_第4頁
漢英統(tǒng)計(jì)學(xué)術(shù)語建庫探索與思考_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、漢英統(tǒng)計(jì)學(xué)術(shù)語建庫探索與思考陶李春陸曉蕾南京郵電大學(xué)外國語學(xué)院南京大學(xué)外國語學(xué)院南京師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院摘要:對通過平行術(shù)語抓取技術(shù)所搜集的3852對漢英對照統(tǒng)計(jì)學(xué)術(shù)語展開統(tǒng)計(jì)分析, 簡要介紹了統(tǒng)計(jì)學(xué)術(shù)語庫的創(chuàng)建過程,并運(yùn)用漢英分詞統(tǒng)計(jì)軟件分析其形式特 征,從而對統(tǒng)計(jì)學(xué)術(shù)語的經(jīng)濟(jì)指數(shù)進(jìn)行比較分析,結(jié)果顯示統(tǒng)計(jì)學(xué)術(shù)語的主要 構(gòu)成模式是:低頻修飾詞+高頻主體詞;術(shù)語構(gòu)造中的連字符”雖然可使術(shù)語 更容易理解,但是會降低一定的經(jīng)濟(jì)指數(shù);中文術(shù)語的經(jīng)濟(jì)指數(shù)遠(yuǎn)遠(yuǎn)高于英語的 術(shù)語經(jīng)濟(jì)指數(shù)。關(guān)鍵詞:統(tǒng)計(jì)學(xué)術(shù)語;術(shù)語庫;分詞;經(jīng)濟(jì)指數(shù);作者簡介:陶李春(1981),男,南京郵電大學(xué)外國語學(xué)院講師,南京大學(xué)外 國

2、語學(xué)院博士生,研究方向?yàn)樾g(shù)語翻譯。通信方式:449251406qq. com。收稿日期:2016-11-02基金:國家社科基金重點(diǎn)項(xiàng)目“人文社會科學(xué)漢英動態(tài)術(shù)語數(shù)據(jù)庫的構(gòu)建研究” 仃1ayy002)的部分研究成果exploration on databaseconstruetion for chinese-englishstatistics terminologytao lichun lu xiaoleiabstract:in this paper, word segmentation techniques are used to analyze the form features of 38

3、52 pairs of statistical terms, which are captured by parallel terms grasping technique. in addition, a model is established to compare the economic rate of statistical terms. our resuits show that statistical terms are consisted of 1ow-frequency modifier and high-frequcncy main word; that although h

4、yphcn will reduce the cconomic index, it will make the terms easier to understand; and that the economic index of chinese terms is much higher than that of english. based on these findings, we put forward two basic principles, and introduce the construction process of terminology database.keyword:st

5、atistical term; terminology datobasc; word segmcntation; cconomic index;received: 2016-11-02引言術(shù)語是學(xué)科專業(yè)知識在語言屮的結(jié)晶,其所表征的概念或范疇,以及由這些概 念和范疇所構(gòu)成的學(xué)術(shù)話語,均為人類物質(zhì)文明和精神文明延續(xù)傳承的基本條 件ul統(tǒng)計(jì)學(xué)術(shù)語是統(tǒng)計(jì)學(xué)概念、原理的重要表征,是該學(xué)科及相關(guān)領(lǐng)域?qū)W術(shù) 交流的重要媒介,是學(xué)術(shù)傳承與發(fā)展的重要見證。隨著信息技術(shù)的不斷普及,術(shù)語建庫已成為術(shù)語學(xué)、術(shù)語翻譯研究等相關(guān)領(lǐng)域的 重要手段。南京大學(xué)外國語學(xué)院魏向清教授主持的國家社科基金重點(diǎn)項(xiàng)冃,題為“人文社會科學(xué)動

6、態(tài)術(shù)語數(shù)據(jù)庫的構(gòu)建研究”,涵蓋了 22個(gè)學(xué)科,其中包括統(tǒng) 計(jì)學(xué)漢英術(shù)語庫的構(gòu)建與研究。通過術(shù)語建庫,能夠?qū)y(tǒng)計(jì)學(xué)術(shù)語的漢英對照情 況做全面而系統(tǒng)的探究。一漢英統(tǒng)計(jì)學(xué)術(shù)語形式特征分析1. 漢英統(tǒng)計(jì)學(xué)術(shù)語的自動抽取介紹術(shù)語抽取的基本理論是基于其結(jié)合緊密性和領(lǐng)域性這兩個(gè)特征宜。以“擺動指 數(shù)”這個(gè)統(tǒng)計(jì)學(xué)術(shù)語為例,在前期對初始數(shù)據(jù)庫分詞之后,這個(gè)術(shù)語被分為“擺動”和“指數(shù)”兩個(gè)詞語,結(jié)合關(guān)聯(lián)挖掘的思想,在統(tǒng)計(jì)學(xué)的數(shù)據(jù)庫中, 這兩個(gè)詞同時(shí)出現(xiàn)的概率遠(yuǎn)遠(yuǎn)大于其他類目的數(shù)據(jù)庫,所以在這種情況下,數(shù) 據(jù)庫會新增一個(gè)名為“擺動指數(shù)”的術(shù)語,這就是術(shù)語結(jié)合緊密性和領(lǐng)域性的 體現(xiàn)。具體的提取過程簡要介紹如下:仃)考

7、慮到初始的統(tǒng)計(jì)學(xué)數(shù)據(jù)庫不可能也無法涵蓋所有的文章,所以只選取了 一定數(shù)量的不同級別的統(tǒng)計(jì)學(xué)期刊或與統(tǒng)計(jì)學(xué)相關(guān)的期刊,并以論文題目為參 考標(biāo)準(zhǔn),選擇了各期刊不同年份的一定數(shù)量的論文,形成統(tǒng)計(jì)學(xué)數(shù)據(jù)庫。(2)然后對統(tǒng)計(jì)學(xué)數(shù)據(jù)庫進(jìn)行分詞,統(tǒng)計(jì)出各個(gè)單詞的出現(xiàn)頻率,將出現(xiàn)頻率 較多(達(dá)到一定的閾值)的單詞作為抽取出的簡單術(shù)語。(3)結(jié)合上述的結(jié)合緊密性和領(lǐng)域性的特征,通過比對不同學(xué)科之間復(fù)合詞岀 現(xiàn)頻率的不同來抽取復(fù)合術(shù)語。(4)將簡單術(shù)語和復(fù)合術(shù)語整理歸類,通過專家討論會的形式篩選岀最終確定 的統(tǒng)計(jì)學(xué)術(shù)語列表。(5)通過相關(guān)匹配技術(shù),匹配出漢英雙語對應(yīng)的統(tǒng)計(jì)學(xué)術(shù)語列表。2. 英文統(tǒng)計(jì)學(xué)術(shù)語的形式特征

8、對通過上述過程抽取到的3852條英文統(tǒng)計(jì)學(xué)術(shù)語進(jìn)行簡單的文木分析,英文的 文本分析主要使用r語言編程進(jìn)行,主要是使用“tm”包構(gòu)建語料庫(corpus 對彖),實(shí)際的操作過程屮,因?yàn)橐脄前抓取的英文術(shù)語向量構(gòu)建語料庫, 所以使用ucorpus”和uvector sourcev函數(shù)配合使用,從而創(chuàng)建一個(gè)corpus 對象(語料庫對象,即每個(gè)單詞岀現(xiàn)的次數(shù)),為了避免與術(shù)語沒有實(shí)際聯(lián)系 的噪聲,使用參數(shù)“remove punctuation”移除標(biāo)點(diǎn)等符號,木次主要是在去 除左右括號、連字符、引號等符號的影響后對每個(gè)單詞的出現(xiàn)頻率進(jìn)行分析。從屮提取到2558個(gè)單詞,總頻數(shù)是9035,可見每個(gè)統(tǒng)計(jì)

9、學(xué)術(shù)語的長度大約是3. 53個(gè)單詞;其中1465個(gè)單詞只出現(xiàn)了一次;2403個(gè)單詞出現(xiàn)的次數(shù)小于10次 (對corpus對象進(jìn)行按照出現(xiàn)次數(shù)進(jìn)行匯總排序);其中出現(xiàn)次數(shù)超過70次的有 10個(gè)單詞(如表1所示),將其稱為統(tǒng)計(jì)學(xué)的主體詞,分別是distribution lest、 model> sampling、 design、 estimator regression method function、 analysis;其中distribution (分布)和test (檢驗(yàn))岀現(xiàn)的次數(shù)最高,可見統(tǒng) 計(jì)學(xué)是一個(gè)研究數(shù)據(jù)的分布和進(jìn)行假設(shè)檢驗(yàn)的學(xué)科;從中還可以發(fā)現(xiàn),這10個(gè) 單詞都是名詞,并且

10、大都處在各個(gè)術(shù)語的末尾部分,有一部分處在頭部(比如 一部分的sampling),剩余的單詞都是對這些單詞的具體補(bǔ)充,稱為修飾詞。 而出現(xiàn)頻率較低的單詞中,具有名字屬性的單詞較多,由于名字翻譯并沒有標(biāo) 準(zhǔn)的翻法,這就給統(tǒng)計(jì)學(xué)術(shù)語的中英互譯造成了一定的困難。單詞頻數(shù)頻distribution349test265model135sampling103design101estimator94regression92method86function77analysis713.中文統(tǒng)計(jì)學(xué)術(shù)語的形式特征對上述英文相對應(yīng)的3852條漢語統(tǒng)計(jì)學(xué)術(shù)語進(jìn)行分析,其中268條是“英文+ 中文”的形式,仔細(xì)觀察后發(fā)現(xiàn),

11、英文部分大多是人名詞,所以在下面分析的 時(shí)候不考慮這部分。對剩下的3584條屮文術(shù)語進(jìn)行屮文分詞,本次屮文分詞分析直接借助了大數(shù)據(jù) 語義分析平臺,最后得到2154個(gè)中文詞,總頻數(shù)10 899,其中1054個(gè)中文詞 只出現(xiàn)了一次;1937個(gè)中文詞出現(xiàn)的次數(shù)小于10次;其中出現(xiàn)次數(shù)超過90次的 有10個(gè)單詞(如表2所示,對從平臺中得到的結(jié)果使用r語言進(jìn)行進(jìn)一步的清 洗和分析),分別是“檢驗(yàn)”(連字符)“量” “模型”“差”“冋歸”“估計(jì)”“圖”“多”等參數(shù),其屮“檢驗(yàn)” (test)和出現(xiàn)的次數(shù) 最高,在出現(xiàn)頻率較低的單詞中,具有名字和地點(diǎn)屬性的單詞較多,這一點(diǎn)與 英文術(shù)語是一致的,由于中文分詞技

12、術(shù)的欠缺性,分詞的結(jié)果并不理想,比如 “差”和“多”這兩個(gè)詞應(yīng)該以詞語的形式體現(xiàn)出才更好。表2屮文高頻詞匯表下載原表詞匯頻數(shù)檢驗(yàn)224153ibi 雖140模型129差114回歸109估計(jì)108圖98多93通過對中英術(shù)語的分詞分析,發(fā)現(xiàn)如下兩點(diǎn)規(guī)律:(1)統(tǒng)計(jì)學(xué)術(shù)語的長度特點(diǎn):在去除中英混雜的3584個(gè)漢語術(shù)語中,67. 94%的中 文術(shù)語長度是46個(gè)字,其屮4個(gè)漢字的最多,占了 32.48%;在3854個(gè)英文統(tǒng) 計(jì)學(xué)術(shù)語中,83. 94%的術(shù)語由23個(gè)英文單詞組成(連字符相連的單詞視作一個(gè) 單詞),其中59. 03%的術(shù)語只由兩個(gè)單詞構(gòu)成。(2)統(tǒng)計(jì)學(xué)術(shù)語形成模式特點(diǎn): 對于中文的統(tǒng)計(jì)學(xué)復(fù)合

13、術(shù)語,主要由一個(gè)名詞充當(dāng)形容詞(低頻修飾詞)加一 個(gè)名詞(高頻主體詞)。二漢英統(tǒng)計(jì)學(xué)術(shù)語互譯策略及方法描述基本原則是分而譯z,往往先將術(shù)語拆分為兩部分,術(shù)語的主體詞往往比較容 易找到對應(yīng)的譯文,而且對應(yīng)的譯文往往就是英語術(shù)語分析中出現(xiàn)頻率最高的 兒個(gè)單詞之一,例如“分布”對應(yīng)distribution, “檢驗(yàn)”對應(yīng)test,"模 型”對應(yīng)model,"抽樣”對應(yīng)sampling,"估計(jì)量”對應(yīng)estimator,"回 歸”對應(yīng)regression, “設(shè)計(jì)”對應(yīng)design,等等,剩下的便是修飾詞,可能 是數(shù)量詞、人名、慣用法等等。1. 直譯法直譯法是將

14、意義上與英語術(shù)語中相同或相似的詞語或短語直接翻譯過來,這是 術(shù)語英譯的主要途徑rl譯者只要準(zhǔn)確把握中文術(shù)語的意義,就可以找到對應(yīng) 詞。直譯法能夠充分忠實(shí)于原文,使譯語和原語的信息密度保持高度致,如下 幾點(diǎn)情況下直譯法較為常見:(1)術(shù)語構(gòu)成詞的表意和其實(shí)際意義相似或者一致;(2)可拆分的復(fù)合術(shù)語, 拆分后的單詞滿足情況(1) ; (3)約定而成的特定含義的單詞。比如“單純形” 和simplex的互譯,"因子”與factor的互譯。術(shù)語的高頻主體詞部分往往符合狀況(1),可以直接使用直譯,而低頻修飾詞 部分情況比較復(fù)雜,需要多種譯法綜合考慮。2. 音譯法音譯法是借詞的一種重要手段和表現(xiàn)

15、形式。趙元任提出,語言甲借用語言乙的詞 匯,通過自身與之相當(dāng)?shù)囊魜懋?dāng)一個(gè)詞使用血。術(shù)語翻譯中音譯法十分常見, 尤其是在語言差異和文化差異十分明顯的情況下,咅譯法占比較大,因此有必 要對音譯進(jìn)行統(tǒng)計(jì)分析和深入研究。三漢英統(tǒng)計(jì)學(xué)術(shù)語系統(tǒng)經(jīng)濟(jì)指數(shù)對比分析1. 術(shù)語形成的經(jīng)濟(jì)律簡介馮志偉先生提岀了術(shù)語形成的經(jīng)濟(jì)律,這是我國學(xué)者對術(shù)語學(xué)基本理論研究的 一個(gè)重要貢獻(xiàn)。術(shù)語形成的經(jīng)濟(jì)律反映了術(shù)語系統(tǒng)內(nèi)的術(shù)語構(gòu)詞規(guī)律,是語言經(jīng) 濟(jì)機(jī)制的一種體現(xiàn)。在一個(gè)術(shù)語系統(tǒng)中,系統(tǒng)的經(jīng)濟(jì)指數(shù)e與術(shù)語的平均長度l 的乘積,恰恰等于單詞的術(shù)語構(gòu)成頻率f5。用公式表示為:f = el在術(shù)語經(jīng)濟(jì)指數(shù)的公式屮,f表示單詞的術(shù)語構(gòu)成頻

16、率,e表示術(shù)語系統(tǒng)的經(jīng)濟(jì) 指數(shù),l表示術(shù)語的平均長度,通過相關(guān)公式能給上述公式中的每一個(gè)變量進(jìn)行 界定和計(jì)算,具體可以表述為:單詞的術(shù)語構(gòu)成頻率f=r/w (其中r是指術(shù)語系 統(tǒng)中的單詞總數(shù),w是指不同的單詞數(shù)量);術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù)公式為:e=t/w (其中t指系統(tǒng)的術(shù)語數(shù)量,w的指稱同上);術(shù)語的平均長度計(jì)算公式為:l二r/t (r和t同上,分別指單詞總數(shù)及術(shù)語數(shù)量)回。對于一個(gè)術(shù)語系統(tǒng)而言,其經(jīng) 濟(jì)指數(shù)越大,系統(tǒng)的經(jīng)濟(jì)效應(yīng)就越高,因此提高系統(tǒng)的經(jīng)濟(jì)指數(shù)的最好辦法是 在盡量不過大改變術(shù)語的平均長度l的情況下,增加單詞的術(shù)語構(gòu)成頻率,所 以在術(shù)語形成的過程中,將會產(chǎn)牛大量的詞組型術(shù)語,使詞組

17、型術(shù)語的數(shù)量大 大超過單詞型術(shù)語的數(shù)量固。在實(shí)際的術(shù)語系統(tǒng)中,詞組型術(shù)語一般都占據(jù)大 部分,這個(gè)事實(shí)正是術(shù)語形成的經(jīng)濟(jì)指數(shù)作用結(jié)果。2. 中英統(tǒng)計(jì)學(xué)術(shù)語的經(jīng)濟(jì)指數(shù)分析這里通過r語言中的tin包和reshape2包對相關(guān)指標(biāo)進(jìn)行了測算,其中tin包負(fù) 責(zé)文木挖掘,用來進(jìn)行多種情況分詞比較,形成相應(yīng)的語料庫對象,reshape2 包是進(jìn)行數(shù)據(jù)整合的,以特定的形式輸出數(shù)據(jù),結(jié)果如下所示:系統(tǒng)經(jīng)濟(jì) 指數(shù)(e)英文不做改變1.480英文去除-1.506英文去除停用詞1.488英文去除毎停用詞1.515中文術(shù)語1.664從表中可以看出,對于英語統(tǒng)計(jì)學(xué)術(shù)語來說,由于主體詞占比比較高,停用詞 (如“of”和“

18、the")等雖然都會使得系統(tǒng)的經(jīng)濟(jì)指數(shù)下降,但是下降得并不 明顯,然而對于來說,去除連字符的影響z后,整個(gè)術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù) 從1.48±升到1. 506,產(chǎn)生了巨大的提高,由此可見英語中的“-”雖然能將兩 個(gè)概念之間的聯(lián)系緊密化,讓人更容易理解,但是可能會降低一定的經(jīng)濟(jì)指數(shù)。將平行的兩個(gè)漢英統(tǒng)計(jì)學(xué)術(shù)語系統(tǒng)進(jìn)行對比,中文術(shù)語的經(jīng)濟(jì)指數(shù)遠(yuǎn)遠(yuǎn)高于英 語的術(shù)語經(jīng)濟(jì)指數(shù),這一方面是不同的語言的表現(xiàn)力的差異,另一方面是中文 分詞規(guī)則所致,比如"窗寬”這個(gè)術(shù)語,其對應(yīng)的英文術(shù)語是windows width,“傳染期”對應(yīng)的是infectious period,這兩個(gè)詞的t二1

19、,而中文的r二1,英 文的r=2,這就導(dǎo)致了中文的經(jīng)濟(jì)指數(shù)較大,體現(xiàn)了中文對術(shù)語表達(dá)的一定的 優(yōu)越性。四漢英動態(tài)術(shù)語庫編撰說明術(shù)語數(shù)據(jù)庫(terminology database),簡稱術(shù)語庫,用以存儲術(shù)語數(shù)據(jù)£21。 術(shù)語庫也被稱作“存儲在電子計(jì)算機(jī)中記錄概念和術(shù)語的自動化電子詞 典”口1。在信息技術(shù)飛速發(fā)展和日益推廣的今天,創(chuàng)建術(shù)語庫并利用術(shù)語庫來 支撐翻譯實(shí)踐和開展語言研究已成為現(xiàn)實(shí)。術(shù)語庫最人的特點(diǎn)是能快速檢索相關(guān) 信息,并在使用術(shù)語庫的同時(shí)及時(shí)更新術(shù)語庫,開展相關(guān)研究,有效促進(jìn)術(shù)語 標(biāo)準(zhǔn)化與規(guī)范化,杜絕術(shù)語使用混亂等情況,進(jìn)而確保翻譯質(zhì)量。下文以統(tǒng)計(jì)學(xué) 漢英動態(tài)術(shù)語庫為例,

20、簡要介紹由統(tǒng)計(jì)學(xué)術(shù)語構(gòu)建的漢英動態(tài)術(shù)語庫。1. 動態(tài)術(shù)語庫數(shù)據(jù)項(xiàng)說明本說明參考南京大學(xué)“人文社會科學(xué)漢英動態(tài)術(shù)語數(shù)據(jù)庫的構(gòu)建研究”項(xiàng)目語 料庫編撰說明,下文針對統(tǒng)計(jì)學(xué)術(shù)語庫構(gòu)建屮比較重要的幾項(xiàng)指標(biāo)項(xiàng)進(jìn)行一定 的解釋。(1) 詞性為防止中英詞性的混亂,統(tǒng)一以n.、v.、adj.、adv.等英文縮寫來標(biāo)記詞性;如 有多重詞性,用“廠'隔開,事實(shí)上統(tǒng)計(jì)學(xué)術(shù)語庫中以名詞性的術(shù)語為主,所以 詞性默認(rèn)標(biāo)記為n. o(2) 漢語語境/英文語境本庫的“漢語語境”與“英文語境”均為學(xué)術(shù)語境,且原則上要求是平行語境, 在統(tǒng)計(jì)學(xué)術(shù)語庫的構(gòu)建中要求術(shù)語的漢英語境應(yīng)選自統(tǒng)計(jì)學(xué)的權(quán)威期刊、雜志、 會議,口中英文應(yīng)

21、表達(dá)同一個(gè)意思;為了便于理解術(shù)語,語境不能為簡短單句或 傳統(tǒng)定義模式,應(yīng)達(dá)到一定數(shù)量的字?jǐn)?shù)或字符要求。(3) 庫內(nèi)關(guān)聯(lián)術(shù)語即在該學(xué)科總術(shù)語表中與該術(shù)語有語義關(guān)聯(lián),或?qū)儆谕恍g(shù)語系統(tǒng)的參見術(shù)語, 或是常常一起出現(xiàn)在同一個(gè)語境的術(shù)語。比如“回歸”和“殘差” “方差分析” 和“方差齊次性”應(yīng)該屬于庫內(nèi)關(guān)聯(lián)術(shù)語。2. 術(shù)語庫數(shù)據(jù)項(xiàng)編撰心得匯總在本次統(tǒng)計(jì)學(xué)術(shù)語庫的編撰過程中,遇到一些困難和問題,通過項(xiàng)目團(tuán)隊(duì)研討 和專家評審等途徑加以處理。本次動態(tài)術(shù)語庫原則上應(yīng)該以“漢英”為主,但是 統(tǒng)計(jì)學(xué)諸多的概念都是源于歐美,術(shù)語含義應(yīng)該以英語為主,所以術(shù)語庫也應(yīng) 該以“英漢”為主,最后還是通過計(jì)算機(jī)的平行術(shù)語抽取和

22、專家學(xué)者的多輪討 論、修改、刪減避免了這個(gè)問題。對于上述的諸多字段來說,語境信息的查找與修改是最大的問題,也是本次編 著的主要難點(diǎn)與重點(diǎn)。首先并沒有一個(gè)途徑可以找到所有或者是大部分的術(shù)語的 平行語境信息。其次,在大部分找到的平行語境中有一部分的中文或者英文的語言表述有一定的問題,難以直接使用,這時(shí)我們述需要理解語境,并且對其表 述的語言進(jìn)行一定的修改。通過各種方式的嘗試,我們發(fā)現(xiàn)通過以下幾個(gè)途徑尋找到一定的平行語境:(1) 庫內(nèi)檢索這是應(yīng)“人文社會科學(xué)漢英動態(tài)術(shù)語數(shù)據(jù)庫的構(gòu)建研究”項(xiàng)目的需要,在前期 準(zhǔn)備階段構(gòu)建的一個(gè)數(shù)據(jù)庫,主要包括一定的相關(guān)論文的摘要,可供參考檢索。(2) 碩博論文摘要通過

23、國內(nèi)學(xué)術(shù)電子資源如“中國知網(wǎng)” “萬方”等,查找含有相關(guān)中文術(shù)語或 對應(yīng)英文術(shù)語的碩博論文摘要,可獲取漢英平行語境信息,其中學(xué)科領(lǐng)域、檢索 條件可細(xì)化。(3) 谷歌學(xué)術(shù)/百度學(xué)術(shù)推薦檢索方式如下:檢索“英文術(shù)語”(對英文字符加雙引號,以增加檢索的準(zhǔn) 確性),在界面左側(cè)選擇“中文網(wǎng)頁”,便于查找雙語信息。(4) cnki翻譯助手不同于一般的英漢互譯工具,cnki翻譯助手是以cnki總庫所有文獻(xiàn)數(shù)據(jù)為依據(jù), 匯集從c¥k1系列數(shù)據(jù)庫中挖掘整理出的800余萬常用詞、專業(yè)術(shù)語、成語、俚 語、固定用法、詞組等中英文詞條以及1500余萬雙語例句、500余萬雙語文摘, 形成海量中英在線詞典和雙語平

24、行語料庫。(5) 相關(guān)實(shí)體書籍查閱主要有上海外語教育出版社的英漢漢英統(tǒng)計(jì)詞匯使用手冊和劍橋大學(xué)出版社 (cambridge university press)的 the cambridge dictionary of statistics (third edition)(劍橋統(tǒng)計(jì)學(xué)詞典(第三版)兩木比較權(quán)威的書。(6) 其他學(xué)術(shù)信息網(wǎng)站統(tǒng)計(jì)學(xué)術(shù)語的檢索還可以參考以下網(wǎng)站(詳見表4)。學(xué)術(shù)網(wǎng)站名稱cnki學(xué)問http: / /xuewen,cnki>ne1術(shù)語信息網(wǎng)http: /term.blcu>edu>ccnki i具書館http: /gongjushu>cnklde

25、fault, as px中國關(guān)鍵詞http: /www. china. org.( china key words /此外,在參與編撰的過程中,述遇到了一些其他問題,并通過組內(nèi)討論交流等 方式處理了這些問題,總結(jié)如下:仃)編撰期間可以通過“新建一個(gè)txt文木”進(jìn)行過渡來自動過濾文木格式, 保證所粘貼的信息在平臺上能夠識別,否則容易保存失??;(2) 確保每個(gè)數(shù)據(jù)項(xiàng)屮所填信息的第一個(gè)和最后一個(gè)字符不是空格,否則會引 起保存失??;(3) 在英文語境中,對于某些符號,比如“”,由于平臺無法識別而無法保存, 所以要避免這類符號的出現(xiàn)。從統(tǒng)計(jì)學(xué)語境搜索反觀統(tǒng)計(jì)學(xué)術(shù)語庫建設(shè)現(xiàn)狀,在國內(nèi)擁有資源最豐富的術(shù)語 庫或許是cnk翻譯助手,不僅涉獵各個(gè)領(lǐng)域,而且還提供了譬如英漢詞語、短語, 甚至是整句的翻譯檢索,并提供相關(guān)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論