




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、-作者xxxx-日期xxxx搭建屬于自己的機器翻譯系統(tǒng)【精品文檔】搭建屬于自己的機器翻譯系統(tǒng) MTI專業(yè)“技術(shù)小白”走進小牛翻譯開源社區(qū)的心得搭建屬于自己的機器翻譯系統(tǒng)MTI專業(yè)“技術(shù)小白”走進小牛翻譯開源社區(qū)的心得首先,自我介紹一下。我是一個MTI(翻譯碩士)專業(yè)、沒有計算機編程背景、沒有機器翻譯理論基礎(chǔ)的菜鳥,任職于一家網(wǎng)絡(luò)科技公司的市場部門,之前的工作中需要做些翻譯工作,有時候求助百度翻譯、有道翻譯等免費的機器翻譯系統(tǒng)來解決問題,但是對于一些涉及我們商業(yè)機密的數(shù)據(jù),由于擔(dān)心泄密,只能借助于有道詞典查查詞,然后再自己形成翻譯結(jié)果。很早之前我就想,要是能有自己的機器翻譯系統(tǒng)就好了。我心目中的
2、翻譯技術(shù)大牛、對外經(jīng)貿(mào)大學(xué)的崔啟亮老師曾在微博中給MTI的學(xué)生提建議,“學(xué)好翻譯技術(shù),有前途。對于仍在迷茫MTI的同學(xué),我建議學(xué)機器翻譯設(shè)計與開發(fā),走出迷茫?!狈浅7浅P疫\的是,我一個東大畢業(yè)的同學(xué)告訴我,東北大學(xué)自然語言處理實驗室(國內(nèi)搞機器翻譯最好的團隊之一)聯(lián)合沈陽雅譯網(wǎng)絡(luò)技術(shù)有限公司推出了“小牛翻譯開源社區(qū)”,社區(qū)中有一項內(nèi)容,就是教不懂機器翻譯的人學(xué)習(xí)“快速搭建自己的機器翻譯系統(tǒng)”。于是,我走進社區(qū),按照社區(qū)里的相關(guān)說明,親身體驗了搭建過程。下面,我想談?wù)勥@個被譽為“目前國內(nèi)首個以機器翻譯為核心的交流平臺”的菜鳥級用戶體驗。小牛翻譯開源社區(qū)里提供了統(tǒng)計機器翻譯開源系統(tǒng)的全部代碼。我了
3、解了一下,NiuTrans開源系統(tǒng)在國際上比較有名,據(jù)說是目前國際上能夠支持統(tǒng)計機器翻譯模型最全的兩套統(tǒng)計機器翻譯系統(tǒng)之一(另一套是愛丁堡大學(xué)的Moses)。這些內(nèi)容對MT(機器翻譯)的專業(yè)學(xué)者應(yīng)該很有用吧,但是對于我這個非科班出身的人來說,其實會完全忽略這部分內(nèi)容。我還是講講我在社區(qū)里的真正收獲快速搭建實用的機器翻譯系統(tǒng)。一、搭建過程詳細(xì)說明需要說明的是,我是在在網(wǎng)頁指導(dǎo)與人工指導(dǎo)下才在自己的電腦(Windows7 64位系統(tǒng),硬盤500G,內(nèi)存8G)上成功搭建機器翻譯系統(tǒng)的。解釋一下為什么我不僅看了網(wǎng)頁上操作指導(dǎo),還需要人工指導(dǎo)。身為“技術(shù)小白”的我,雖然網(wǎng)頁上的操作指導(dǎo)寫的很規(guī)范,但是第
4、一次接觸這么“高大上”的東西,還是有點小緊張的。于是,我加入了小牛翻譯開源社區(qū)的QQ群(群號451967838),聯(lián)系了群主,群主很熱心的幫我講解,在服務(wù)方面我的用戶體驗很好。下面我就與大家分享我如何一步步完成在自己電腦上搭建機器翻譯系統(tǒng)的。第一步,進入“小牛翻譯開源社區(qū)”網(wǎng)站(),接著進入“搭建MT系統(tǒng)”界面。如圖:第二步,根據(jù)自己電腦的操作系統(tǒng)(Windows系統(tǒng)還是Linux系統(tǒng)),選擇合適的“NiuTrans Server工具包”(之所以叫NiuTrans Server,據(jù)說是因為這個工具包是針對單服務(wù)器的,或者說,這個工具包還不能用于搭建機器翻譯云平臺)。小牛翻譯開源社區(qū)的群主告訴我
5、,目前正式運行的機器翻譯系統(tǒng),都是在Linux操作系統(tǒng)下安裝的,但Linux系統(tǒng)下沒有圖形界面,需要用戶稍微懂一些代碼。為了方便像我這樣的用戶,他們很貼心地研發(fā)出Windows系統(tǒng)下如何搭建機器翻譯系統(tǒng)的方法(此處值得為他們點贊哦)。第三步,點擊“Windows版搭建教程,下載“NiuTrans Server工具包”。根據(jù)語言方向和電腦內(nèi)存的大小,社區(qū)里提供了四個工具包。由于我的電腦內(nèi)存總共只有8G,所以選擇的是“中譯英Windows4G版”。點擊下載即可。第四步,安裝perl。我是在人工指導(dǎo)下完成的,一共需要四步操作才能完成。首先,點擊上面網(wǎng)頁中“運行環(huán)境準(zhǔn)備”項中的“Perl下載地址”。如
6、下圖:Step 1、進入“Perl-download”頁面,點擊“Windows”圖標(biāo)。Step 2、點擊頁面中“DOWNLOAD ACTIVEPERL”,即頁面上Windows下右面第一個圖標(biāo)。大家可以看一下左側(cè)的英文說明,除了64位操作系統(tǒng),32位操作系統(tǒng)也可以支持的。Step 3、在新的頁面中,點擊“Download ActivePerl 5.22.1 forWindows (64-bit,x64)”(我的電腦是64位系統(tǒng))。Step 4、在新的頁面中,會自動彈出一個下載框。經(jīng)過以上操作就可以成功下載Perl。第五步,做了以上準(zhǔn)備工作后,接下來進入搭建步驟。搭建共分兩步,Step 1、解
7、壓工具包。找到剛剛下載的工具壓縮包,windows 7系統(tǒng)可直接右鍵解壓到“當(dāng)前文件夾”,解壓后的文件夾名稱為“NiuTransServer_v1.1.0_zh2en_x64_window”。打開文件夾如下圖:Step 2、啟動機器翻譯系統(tǒng)。點擊上圖文件夾中“service”文件夾,進入文件夾內(nèi),找到“(BAT腳本文件)”,雙擊該文件即實現(xiàn)啟動機器翻譯系統(tǒng)。如圖:第六步,搭建操作全部完成后,頁面會出現(xiàn)下列提示即代表啟動成功。下圖是社區(qū)指導(dǎo)步驟中給的樣圖。其實操作者只要看最后一句“Server startup in XXX ms”即可,代表專屬于你的機器翻譯系統(tǒng)已經(jīng)搭建成功,此處特別提醒,該頁面
8、不可以關(guān)閉,要想運行機器翻譯系統(tǒng),要保持著該頁面一直打開狀態(tài)。第七步,將該“http:/:1517/niutrans/”網(wǎng)址粘貼到瀏覽器中,即可彈出如下圖頁面:然后嘛,就可以開始使用機器翻譯系統(tǒng)了!以上就完成在自己電腦中搭建機器翻譯系統(tǒng)的全過程。在“指導(dǎo)搭建機器翻譯系統(tǒng)”頁面中還介紹了很多小牛翻譯系統(tǒng)的其他功能。如翻譯API功能、利用自有數(shù)據(jù)訓(xùn)練翻譯模型等,經(jīng)過好一頓的研究,被社區(qū)群主告知這些功能都是為機器翻譯專業(yè)人士準(zhǔn)備的,不懂程序的人無法直接使用。特此提醒其他使用者,完成我上述七步操作,專屬于你的機器翻譯系統(tǒng)就搭建成功了,其他的小牛翻譯系統(tǒng)各種功能就只能根據(jù)使用者自身的能力來選擇使用了。二
9、、對小牛開源社區(qū)的建議社區(qū)內(nèi)搭建機器翻譯系統(tǒng)的方法實現(xiàn)起來真的很便捷,但是對搭建過程中的某些技術(shù)指導(dǎo)表述不夠清晰,建議以下部分應(yīng)該有改進。1)安裝perl環(huán)節(jié)應(yīng)該添加詳細(xì)介紹。在上一部分我的搭建過程中,我詳細(xì)了介紹了安裝perl的步驟。安裝perl的網(wǎng)頁是全英文版,由于我是翻譯碩士所以我讀起來較輕松,但是對于英語水平不太高的使用者,閱讀起來會比較困難,這會導(dǎo)致此部分的操作有一定難度。希望社區(qū)開發(fā)者會進一步詳細(xì)介紹一下如何選擇各個步驟的下載選項。2)“代表啟動成功”的展示圖片需修改。應(yīng)提示,操作者只要看最后一句“Serverstartup in XXX ms”即可,這就代表專屬于你的機器翻譯系統(tǒng)
10、已經(jīng)搭建成功,亦在圖片中明顯標(biāo)畫出來,讓操作者可以非常清晰操作思路。如下圖:3)截下圖,只想表達,下圖的解釋說明雖然可以看得懂,但是卻不清晰,典型的程序猿表達方式。如果想要提升用戶體驗,某些表達也可以優(yōu)化一下。我相信,隨著大家對機器翻譯的需求逐漸興起以及對數(shù)據(jù)翻譯安全的考慮,這種可以在自己電腦上搭建機器翻譯系統(tǒng)會有越來越多的需求。因此,“詳細(xì)、直白、清晰、簡潔”的搭建過程說明是很有必要的。三、搭建體會作為一名不懂計算機編程、機器翻譯技術(shù)基礎(chǔ)的我,竟然可以實現(xiàn)自己動手搭建機器翻譯系統(tǒng),我都被自己嚇到了,應(yīng)該說小牛翻譯開源社區(qū)給了我很大驚喜。通過自己親手搭建機器翻譯系統(tǒng),雖然我還是不懂機器翻譯技術(shù),但是在使用上,感受到了機器翻譯的更多優(yōu)勢。比如,在自己的電腦上搭建機器翻譯系統(tǒng),使用的穩(wěn)定性、數(shù)據(jù)的安全性均可得到保障。隨著“
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國兔養(yǎng)殖項目創(chuàng)業(yè)計劃書
- 中國黑膠唱片項目創(chuàng)業(yè)計劃書
- 中國基圍蝦項目創(chuàng)業(yè)計劃書
- 中國??祈椖縿?chuàng)業(yè)計劃書
- 中國空氣智能優(yōu)化系統(tǒng)項目創(chuàng)業(yè)計劃書
- 中國定制式義齒項目創(chuàng)業(yè)計劃書
- 中國鵝飼養(yǎng)項目創(chuàng)業(yè)計劃書
- 乙肝藥物治療試題及答案
- 安全教育期末試題及答案
- 乙炔安全試題及答案
- 設(shè)備備品備件管理制度
- 電氣裝置安裝工程接地裝置施工及驗收規(guī)范
- 小區(qū)裝修工程安全協(xié)議書
- 人教版小學(xué)數(shù)學(xué)3三年級下冊(全冊)教案
- 公路應(yīng)急搶險協(xié)議書
- 國家中醫(yī)藥管理局直屬事業(yè)單位招聘筆試真題2024
- 2025年計算機Photoshop功能分析試題及答案
- 經(jīng)濟學(xué)思維方式智慧樹知到期末考試答案2024年
- (高清版)DZT 0145-2017 土壤地球化學(xué)測量規(guī)程
- 基于html5外文參考文獻
- 三環(huán)路道路照明工程技術(shù)標(biāo)
評論
0/150
提交評論