




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
。例如:心寬體胖。機器翻譯:laughandfat.人工翻譯:laughandgrowfat.舉例展示的機器翻譯缺少了對體胖的準確解釋。機器翻譯只能使用基于目標語言和源語言之間的形式和文字含義或淺層含義的文字翻譯,這使得無法復(fù)現(xiàn)源語言文本中成語的語用含義。機器翻譯還有一個避無可避的難點,那就是多義詞的選擇,中文有一些詞匯是具有一詞多義的,例如文字“聽”,既有作為動作傾聽的意思,也有作為量詞,一聽啤酒的意思。機器人翻譯理論認為,在機器人翻譯中,人類的語言可以作為“地基”。對齊語料是實現(xiàn)機器翻譯的關(guān)鍵。之所以能夠順利地完成這一任務(wù),主要有以下幾個方面:基于對齊語料庫,計算機對漢英漢英語料進行了全面的研究。同時,在英漢兩種語言對齊的人工譯文中,也會影響到機器翻譯的品質(zhì)。對一種原語的全面了解,是一切高品質(zhì)翻譯的前提,因為它不具備與人一樣的文化和邏輯思維的力量,人類的思維也理所當然不被機器所理解,這也正是機器翻譯難以出現(xiàn)高質(zhì)量譯文的原因。這時,必須要有人類的幫助。后期潤色和編輯是人類介入機器翻譯的主要形式。翻譯后編輯僅意味著編輯和處理由機器翻譯生成的翻譯,從而使不符合目標語言規(guī)范的文本變得更真實,“更干凈”,更流暢,更美觀,并且方便人類理解和接受。正是由于以上種種原因,漢英輔助翻譯系統(tǒng)才有研究意義,通過機器翻譯和人工翻譯的互補來促進翻譯的發(fā)展。國內(nèi)外研究現(xiàn)狀根據(jù)機器人翻譯中所蘊含的哲學理念,可以將其歸納成理性與實證兩大類型。兩大學說各自發(fā)展出了各自的機器人翻譯理論,即以規(guī)則為基礎(chǔ)的機器人翻譯與以語料庫為基礎(chǔ)的機器人翻譯。從人工翻譯的觀點來看,基于規(guī)則的方法提倡用電腦程序編寫譯文,并采用電腦程序來完成。因為過于依靠人的體驗和認知,所以它的普適性并不高,只適用于特定的專業(yè)。根據(jù)能否直接使用的數(shù)據(jù),可以將基于語料庫的方式劃分為EBMT和以計算機為基礎(chǔ)的計算機翻譯(SBMT)。第一個概念是1984年口本研究者長尾真提出來的,它的中心理念是通過使用匹配事例進行檢索和參考,因而受語料庫的龐大程度的制約,IBM的Brown等人于1990年推出的,它的設(shè)計理念是通過語料庫來直接提取,并且還可以從語料庫中提取出一些沒有的譯文,這樣就可以幫助統(tǒng)計模型進行推理和融會貫通。計算機統(tǒng)計是一種比較完善的翻譯方式,包括詞匯的翻譯模式、短語的翻譯模式、層級的短語和句法的翻譯模式。統(tǒng)計機器翻譯具有良好的一般功能,同時也解決了傳統(tǒng)的檢索過程中遇到的困難,曾一度成為谷歌、百度等企業(yè)的網(wǎng)絡(luò)翻譯的關(guān)鍵技術(shù)。本文的主要研究內(nèi)容該系統(tǒng)設(shè)計過程中利用Python,MySql,Qtdesigner等主要軟件開發(fā)技術(shù)對漢英輔助翻譯系統(tǒng)進行設(shè)計,實現(xiàn)對文本的在線翻譯。漢英輔助翻譯系統(tǒng)的設(shè)計漢英輔助翻譯系統(tǒng)的需求分析漢英輔助翻譯系統(tǒng)要求能做到能夠判斷輸入文本的語言種類,并且能夠翻譯常見文本,無論是單行文本,還是批量文本,都能做到基本表達到原文本的完整內(nèi)容。詞庫管理,漢英輔助翻譯系統(tǒng)要求有3張表,一張生詞表,用于管理生詞,這段要求有單詞,單詞的含義與備注。一張短語表,字段要求有短語,短語的含義,與備注。一張喜歡的句子表格。字段要求有句子,含義,備注。各張表關(guān)系圖如圖2-1,圖2-2,圖2-3所示。圖2-1生詞表E-R圖圖2-2短語表E-R圖圖2-3句子表E-R圖與此同時,漢譯英輔助翻譯系統(tǒng)要求盡量做到輕量級,界面簡單。學習使用成本低,運行配置簡單,低配電腦也能流暢運行。漢英輔助翻譯系統(tǒng)的設(shè)計漢英輔助翻譯系統(tǒng)分為兩部分設(shè)計。第1部分是翻譯功能模塊。第2部分是詞庫管理功能模塊。翻譯部分,為了輕量便捷的考慮,這一部分的功能需求,決定使用API實現(xiàn)。文本輸入和結(jié)果輸出都采用槽函數(shù)實現(xiàn)。詞庫管理模塊選擇MySQL數(shù)據(jù)庫,在數(shù)據(jù)庫中創(chuàng)建3張表,并通過數(shù)據(jù)庫可視化軟件Navicat來實現(xiàn)對數(shù)據(jù)庫中各種表格的操作,實現(xiàn)連接。漢英輔助翻譯系統(tǒng)的界面設(shè)計由QTdesigner來設(shè)計,并為每個控件設(shè)置槽函數(shù)來實現(xiàn)對按鈕的功能。漢英輔助系統(tǒng)的活動圖如圖2-4所示。圖2-4漢英翻譯輔助系統(tǒng)活動圖漢英輔助翻譯系統(tǒng)將設(shè)計兩個類,一個為UI界面設(shè)計,另一個為界面按鈕槽函數(shù)的功能實現(xiàn),UML類圖如圖2-5所示。圖2-5漢英翻譯輔助系統(tǒng)類圖漢英輔助翻譯系統(tǒng)程序的總體流程圖如圖2-6所示。圖2-6漢英翻譯輔助系統(tǒng)流程圖漢英輔助翻譯系統(tǒng)各功能模塊漢英輔助翻譯系統(tǒng)的翻譯功能API選擇:翻譯模塊的實現(xiàn)由API實現(xiàn)功能,再設(shè)置輸入文本和輸出結(jié)果顯示,如今機器翻譯十分發(fā)達,在API上的選擇有很多,谷歌翻譯作為國內(nèi)外享譽最盛的翻譯軟件,是第一選擇,根據(jù)查詢的文獻,經(jīng)過仔細研究,我發(fā)現(xiàn)谷歌翻譯的翻譯規(guī)則是基于語法規(guī)則。它的工作本質(zhì)是通過結(jié)合統(tǒng)計再結(jié)合多于語種行語料庫的平行語料庫,創(chuàng)建大數(shù)據(jù)分析,去解析各種語言之間的內(nèi)在規(guī)律。由訓練好的模型來決定翻譯的結(jié)果。因特網(wǎng)技術(shù)發(fā)展迅速。這讓谷歌在網(wǎng)絡(luò)上的數(shù)據(jù)越來越多,它的特點也越來越突出:海量數(shù)據(jù)庫,不但海量,還包括文字、圖片和語音。雖然谷歌翻譯的技術(shù)已經(jīng)十分發(fā)達。但也面臨著許多問題。統(tǒng)計機器翻譯都有的不足:翻譯的結(jié)果不確定。一些文檔翻譯的結(jié)果恰到好處。但有一些參與的結(jié)果卻不盡人不同題材的文本翻譯效果同樣不確定。例如政治新聞比體育新聞更好翻譯。這些問題。全球的翻譯技術(shù)都沒能很好的解決。由于以上原因,不能僅僅因為谷歌翻譯名氣大便選擇它,更需要詳盡數(shù)據(jù)的支撐。由第二章2.4小節(jié)常見app翻譯對比分析和圖2.11到圖2.29可得出結(jié)論,騰訊翻譯君的翻譯結(jié)果最符合期待,只有騰訊翻譯君的翻譯結(jié)果做到了基本語意的正確翻譯,例如活著感到快樂世界就屬于你這句話的漢英互譯都做到了完整的對應(yīng),且在多義詞的選擇上符合最優(yōu)選擇,例如四海依舊清平中清平的含義最接近clam,其他翻譯軟件的選擇多是clean和clear,這兩個單詞的意思更接近于干凈,清澈,清晰,而且其他軟件還沒有將依舊翻譯過來。根據(jù)在騰訊云官方網(wǎng)站查詢得知,在此基礎(chǔ)上,基于大量的雙語語料庫的自動學習,使其能夠完成從原始語篇到目的語篇的自動化轉(zhuǎn)換。經(jīng)過仔細且慎重的考慮,最終選用了騰訊云機器翻譯的API。漢英輔助翻譯系統(tǒng)詞庫管理模塊UI界面設(shè)計為一個Tabwidget,其內(nèi)包含三個展示頁面,每個頁面由tablewidger和四個按鈕組成。每個頁面的按鈕都有對應(yīng)的槽函數(shù)。生詞表對應(yīng)的四個按鈕函數(shù)btn_nwod_show,該函數(shù)用于查詢生詞表并將生詞表中數(shù)據(jù)展示在TableWidget_nword之中;btn_nword_add,該函數(shù)用于添加數(shù)據(jù)到TableWidget_nword,btn_nwod_del,用于從TableWidget_nword中刪除數(shù)據(jù),btn_nword_modiefy,用于修改數(shù)據(jù),UI框架圖如圖2-7所示。圖2-7詞庫管理UI框架圖數(shù)據(jù)庫設(shè)計MySql數(shù)據(jù)庫名字是test,其中設(shè)置了三張表如圖2-8所示。圖2-8數(shù)據(jù)庫結(jié)構(gòu)生詞表結(jié)構(gòu)如表2-1所示。短語表結(jié)構(gòu)如表2-2所示。喜歡的句子表結(jié)構(gòu)如表2-3所示。表2-1生詞表結(jié)構(gòu)名類型長度是否非空WordVachar255是MeaningVachar255是RemarksVachar255否表2-2短語表結(jié)構(gòu)名類型長度是否非空PhraseVachar255是MeaningVachar255是RemarksVachar255否表2-3喜歡的句子表結(jié)構(gòu)名類型長度是否非空SentenceVachar255是MeaningVachar255是RemarksVachar255否漢英輔助翻譯系統(tǒng)的實現(xiàn)UI界面的實現(xiàn)UI界面如圖3-1所示。圖3-1漢英輔助翻譯系統(tǒng)UI界面實現(xiàn)主要功能描述:設(shè)置主界面的UI,兩個標簽,兩個文本輸入輸出框,一個TabWidget中設(shè)置三個頁面,在每個頁面設(shè)置了四個按鈕,一個TableWidget。翻譯功能的實現(xiàn)漢譯英效果如圖3-2示。英譯漢翻譯效果如圖3-3示。圖3-2漢英輔助翻譯系統(tǒng)漢譯英實現(xiàn)圖3-3漢英輔助翻譯系統(tǒng)英譯漢實現(xiàn)主要功能描述:進行語種識別,返回信息。(2)代碼二:主要功能描述:得到語種識別的結(jié)果,設(shè)置漢英互譯的參數(shù),根據(jù)輸出結(jié)果來確定調(diào)用機器翻譯的參數(shù),最后將得到的結(jié)果返回第二個文本框。詞庫管理功能的實現(xiàn)查詢數(shù)據(jù)庫生詞表的效果實現(xiàn)如圖3-4所示。增加數(shù)據(jù)庫生詞表數(shù)據(jù)的效果實現(xiàn)如圖3-5示。刪除數(shù)據(jù)庫生詞表數(shù)據(jù)的效果實現(xiàn)如圖3-6所示。修改數(shù)據(jù)庫生詞表數(shù)據(jù)的效果實現(xiàn)如圖3-7所示。圖3-4查詢生詞表實現(xiàn)主要特點:設(shè)定sql聲明,運行,并在TableWidget中循環(huán)輸出。圖3-5增加數(shù)據(jù)生詞表實現(xiàn)主要功能描述:獲取已經(jīng)選中行,將其中的數(shù)據(jù)添加到數(shù)據(jù)庫。圖3-6刪除數(shù)據(jù)生詞表實現(xiàn)主要功能描述:獲取選中行第一列數(shù)據(jù),依靠該數(shù)據(jù)作為MySql執(zhí)行語句的參數(shù),從數(shù)據(jù)庫中刪除數(shù)據(jù)并在列表中刷新顯示。圖3-7修改數(shù)據(jù)生詞表實現(xiàn)主要功能描述:獲取選中行行數(shù),然后從表格中獲取第一列數(shù)據(jù),將其作為參數(shù)來執(zhí)行MySql執(zhí)行語句,同步修改數(shù)據(jù)庫中數(shù)據(jù)。系統(tǒng)測試系統(tǒng)功能測試目前軟件工程中測試分為3種:單元測試、白盒測試和黑盒測試。白盒測試是測試程序里的代碼,通過輸入數(shù)據(jù),讓程序走不同的分支流程,看是否達到想要的結(jié)果數(shù)據(jù),進而加以修正,而不使用用戶界面進行程序流程測試;黑盒測試不必通過檢查程序的源代碼或者很清楚地了解該軟件的源代碼程序具體是怎樣設(shè)計的,只需要測試程序界面的流程功能。本章就列舉兩個白盒測試的例子,第一個是平臺的驗證綁定郵箱功能,描述本平臺的測試過程,打開在線輔助翻譯平臺首頁,點擊登錄按鈕,進入登錄頁面,點擊我的頭像,我的賬號。根據(jù)輸入不同數(shù)據(jù),來看是否測試用例能否滿足需求,如表4-1所示:以下是對捆綁消息的測試案例的說明:1.在“綁定郵箱”上單擊該選項;請輸入信箱號碼,驗證代碼單擊“確認”鍵;輸入一個相同的信箱號碼,并按下確認密碼;請鍵入非信箱的格式,并按下確認密碼。如表格4-1所描述的那樣,捆綁信箱測試:表4-1驗證綁定郵箱用例測試用例編號測試內(nèi)容測試步驟預(yù)期結(jié)果T001界面完整性測試打開在線輔助翻譯平臺首頁,點擊登錄按鈕,進入登錄頁面,點擊我的頭像,我的賬號頁面元素完整,各功能按鈕處于可操作狀態(tài)T002正確性輸入驗證輸入正確郵箱的郵箱號,驗證碼點擊“確認'按鈕彈框提示綁定成功T003重復(fù)郵箱驗證輸入重復(fù)的郵箱號,點擊獲取驗證碼提示郵箱已被使用T004非郵箱驗證輸入非郵箱格式,點擊獲取驗證碼提示請點擊登錄按鈕T005判空驗證沒用輸入任何數(shù)據(jù),直接點擊驗證按鈕系統(tǒng)提示用戶請輸入郵箱信息特性模塊二,即時登記,確認伺服器端即時登記的能力。首先,開啟聯(lián)機助手在第一個翻譯的頁面上,單擊“免費”的登記鍵,馬上就可以登記了。請輸入一個合法的信箱/移動電話號碼、口令、驗證代碼,選擇必需選項,然后單擊“注冊”鍵;請單擊「取得驗證密碼」鍵;輸入一個正確和有效的驗證代碼,然后單擊“確定”。使用表格4-2來顯示即時登記的測試。表4-2立即注冊測試用例測試用例編號測試內(nèi)容測試步驟預(yù)期結(jié)果rooi界面完整性測試輸入正確合法的郵箱/手機號,密碼,驗證碼,勾選必選框,點擊“注冊”按鈕。頁面跳轉(zhuǎn),郵箱/手機號驗證roo2功能性輸入驗證點擊“獲取驗證碼”按鈕。手機會有短信提示roo3功能性測試輸入正確且有效的驗證碼,點擊“確定”按鈕。彈框提示綁定成功測試結(jié)果其中,每個模塊的功能都是大同小異的,我們選擇了一個具有典型意義的模塊,對其進行了功能和性能的檢測。服務(wù)程序使用了CentorOS操作系統(tǒng)、tomcatweb服務(wù)器、mysql數(shù)據(jù)庫存儲器、elasticsearch群集搜索引擎、客戶機應(yīng)用Win7操作系統(tǒng),F(xiàn)irexfoxFirexfox,用戶可以在電訊中使用TCP/IP協(xié)議進行連接,所有的功能組件運行良好,數(shù)據(jù)傳輸準確率高。
結(jié)束語對漢英輔助翻譯系統(tǒng)的設(shè)計,讓我充分的感受到了機器翻譯的魅力。基本實現(xiàn)了對翻譯本文的漢譯英和英譯漢,能夠?qū)斎胛谋镜恼Z種進行識別。詞庫管理在設(shè)計UI界面的時候也遇到了一些問題,選擇實現(xiàn)詞庫管理的時候,有考慮到做多界面還是但界面跳轉(zhuǎn)頁面的問題,但處于系統(tǒng)輕量級且便捷性要求的考慮,最終選擇了單界面多頁面的選擇,使用了TableWidget。而MySql數(shù)據(jù)庫和程序的連接也十分成功,對數(shù)據(jù)庫的操作基本的增刪查改通過槽函數(shù)鏈接按鈕也實現(xiàn)了。通過對漢英輔助翻譯系統(tǒng)的測試,實現(xiàn)了人工翻譯和機器翻譯的互補,人工翻譯可以為機器翻譯潤色和修改,機器翻譯又為人工翻譯節(jié)省了大量的工作量,而且由于機器翻譯的工作原理是基于語料庫,人工翻譯又反過來為機器翻譯做出了貢獻,達到了為其潤色的效果。
致謝在本次論文設(shè)計過程中,老師對該論文從選題,構(gòu)思到最后定稿的各個環(huán)節(jié)給予細心指引與教導(dǎo),使我得以最終完成畢業(yè)論文設(shè)計。在學習中,老師嚴謹?shù)闹螌W態(tài)度、豐富淵博的知識、敏銳的學術(shù)思維、精益求精的工作態(tài)度以及侮人不倦的師者風范是我終生學習的楷模,導(dǎo)師們的高深精湛的造詣與嚴謹求實的治學精神,將永遠激勵著我。其次,還要感謝我的父母,他們給予我無微不至的關(guān)懷與支持,給予我充分的物質(zhì)保障和精神鼓勵,支持我完成學業(yè),增強面對生活和挫折的勇氣與信心。最后,還要感謝我的同學,衷心感謝他們給予我工作和學習中的支持、信任與幫助,我將永遠銘記于心。
參考文獻[1]李毓麗,黃澤楷.基于Fields-Mapping的教師檔案管理系統(tǒng)設(shè)計[J].電腦知識與技[1]張菊玲.基于特征提取算法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年小微企業(yè)創(chuàng)業(yè)扶持資金申請申報指南與政策解讀報告
- 2025年生物制藥資金申請報告
- 公司章程及經(jīng)營管理制度
- lng運輸救援管理制度
- 家具公司無合同管理制度
- 東莞大朗藥品店管理制度
- mdr感染手術(shù)管理制度
- 公司精細化財務(wù)管理制度
- 公司檔案室安全管理制度
- 監(jiān)理部上墻安全管理制度
- 蘇少版 音樂 四年級下冊 《我的家在日喀則》 公開課一等獎?wù)n件省賽課獲獎?wù)n件
- 鐵道概論PPT完整全套教學課件
- 投稿版權(quán)轉(zhuǎn)讓協(xié)議書
- 翎云教育試卷二年級下冊數(shù)學
- 淺談心理護理溝通技巧
- 哈薩克斯坦共和國有限責任公司和補充責任公司法
- 軟件技術(shù)專業(yè)實踐報告(五篇)
- 深基坑工程巡視檢查記錄表
- 計數(shù)型量具分析報告(Excel帶計算KAPPA公式)
- GB/T 30889-2014凍蝦
- GB 23971-2009有機熱載體
評論
0/150
提交評論