av日韩亚洲,一本一本a久久,亚洲一区二区三区,亚洲一区二区三区免费视频

基于短語翻譯模型的英語翻譯計算機智能校對方法

來源:期刊VIP網(wǎng)所屬分類:免費文獻發(fā)布時間:2021-06-05瀏覽:

  摘要:為保證機器翻譯準確性,本文提出了基于短語翻譯模型的英語翻譯計算機智能校對方法,通過發(fā)現(xiàn)可代替待校對詞匯的正確詞匯,以實現(xiàn)英語翻譯的自動智能校對。同時詳細設(shè)計了英語翻譯計算機智能校對具體流程,分析了基于最大熵模型的分詞模式。最后通過計算機智能校對代碼實現(xiàn)與測試,得出結(jié)論,英語翻譯結(jié)果校對之前準確率最高只能達到72.9%,而通過英語翻譯計算機智能校對方法完成校對之后,準確率全部保持于99.0%以上,二者準確率差異顯著,表明基于短語翻譯模型的英語翻譯計算機智能校對方法具有顯著有效性與良好穩(wěn)定性,值得大力推廣與應(yīng)用。

  關(guān)鍵詞:短語翻譯模型:英語翻譯;計算機,智能校對

  Abstract: In order to ensure the accuracy of machine translation, this paper proposes an intelligent proofreading method of English translationlbased on phrase translation model. By finding the correct words that can replace the words to be proofread, the automatic intelligent proofreading of English translation can be realized. At the same time, the specific process of intelli-

  gent proofreading of English translation computer is designed in detail, and the word segmentation mode based on the maximum entropy model is analyzed. Finally, through the implementation and test of the computer intelligent proofread-

  ing code, it is concluded that the highest accuracy rate of English translation results can only reach 72.9% before proof-

  reading, but after the completion of proofreading by the computer intelligent proofreading method of English translation. the accuracy rate is all kept above 99.0%. The difference between the two accuracy rates is significant, which shows that the computer intelligent proofreading method of English translation based on the phrase translation model is effective. It has significant effectiveness and good stability, and is worth promoting and applying

  Key words: phrase translation model; English translation; computer; intelligent proofreading

  1引言

  譯文質(zhì)量是衡量英語翻譯結(jié)果的重要標準,主要通過譯文字符或拼寫錯誤、表達不一致、詞法語法錯誤等加以表征。目前除機器翻譯之外,各式各樣的計算機輔助翻譯工具如雨后春筍不斷衍生,很多企業(yè)研發(fā)了與自身需要相符的輔助翻譯工具,但是工具過于側(cè)重于翻譯準確性,產(chǎn)品輕量級,良好使用體驗等,在一定程度上忽視了譯文質(zhì)量,導(dǎo)致后期需耗費大量人工進行校對。而人工校對存在既有缺陷,即速度慢、工作量大,由此便衍生了各種英語翻譯計算機智能校對方法。

  斯·勞格勞通過基于字形與語音的詞法分析器設(shè)計了以不確定有限自動機與有限自動機為載體的自動拼寫校對算法;趙軍基于音節(jié)設(shè)計了統(tǒng)計語言模型的自動校對方法,著重分析了模型設(shè)計與可行性;冉婕與漆麗娟開發(fā)了基于語義與統(tǒng)計的英文機器翻譯改進方法,通過構(gòu)建英文模型與語義分析模型獲取約束規(guī)則語義的規(guī)則,以此改進優(yōu)化英文機器翻譯,此方法雖然時間復(fù)雜度偏低,卻難以建立精確的語法規(guī)則庫,翻譯效果相對較差;馮志偉通過基于短語與句法的英語翻譯校對系統(tǒng),對英語翻譯結(jié)果進行校對分析,注重短語與句法精確性,但是忽視了語境連貫性"。在此基礎(chǔ)上,本文基于短語翻譯模型提出了英語翻譯計算機智能校對方法。

  2英語翻譯計算機智能校對方法設(shè)計不同形式文本的轉(zhuǎn)換時英語翻譯與翻譯校對的共性,所以英語翻譯計算機智能校對流程即面向待翻譯語句進行翻譯,比較并替換校對結(jié)果與翻譯結(jié)果,從而實現(xiàn)智能化校對。

  設(shè)定K為英語翻譯錯誤結(jié)果,P為英語翻譯正確結(jié)果,實現(xiàn)從K向P的轉(zhuǎn)換,便是英語翻譯校對。基于改進短語翻譯模型的計算機翻譯方法即:

  E(P')代表已校對詞匯。

  通過機器翻譯所獲取的英語翻譯結(jié)果中詞匯翻譯精確性需提高,而計算機智能翻譯校對方法注重詞匯翻譯精確性,所以,基于公式(1)優(yōu)化改進實現(xiàn)計算機智能校對,即:

  在英語翻譯計算機智能校對方法闡述中,以K代表待校對詞匯,P'代表已校對詞匯。假設(shè)待校對詞匯中包含q個字符,以K9代表,字符分別對應(yīng)短語翻譯模型中詞匯,且在已校對詞匯中包含1個字符,以P,"代表。假設(shè)劃分K,為隨機d個字符串,以K,"代表,字符串分別對應(yīng)短語翻譯模型中短語。相應(yīng)的,待校對詞匯生成的校對詞匯包括d個字符串,以P,"代表。綜述可獲得公式(2)擴展模式,即:

  英語翻譯計算機智能校對時,著重尋求待校對詞匯的最佳劃分方式,并詳細校對劃分結(jié)果,從而獲得P'排列順序的校對結(jié)果,通過上式所描述方法發(fā)現(xiàn)與待校對詞匯相應(yīng)的詞匯P,從而完成英語翻譯計算機智能校對2。

  3英語翻譯計算機智能校對流程設(shè)計基于短語翻譯模型的英語翻譯計算機智能校對流程設(shè)計主要包含計算機翻譯與智能校對兩部分。

  就翻譯而言,在系統(tǒng)接收輸入源文本之后,進行分句預(yù)處理分析,分句結(jié)果應(yīng)保持整句或者短語狀態(tài),以其為檢索單元輸入檢索。基于數(shù)據(jù)庫匹配與所尋短語類似的短語,將其與對應(yīng)譯文同時返回,并根據(jù)相似度進行排序。為有效提升檢索效率與準確度,且便于評估相似度,系統(tǒng)通過輔助翻譯記憶庫索引源文本與譯文相應(yīng)語料庫。此外,翻譯人員所翻譯的短語可能與其他翻譯員曾翻譯的短語存在較高相似度,或受上下文語境影響,翻譯人員所翻譯短語在文本后續(xù)部分中出現(xiàn)大量類似復(fù)現(xiàn),所以需索引儲存已翻譯短語"。

  就校對而言,加載待校對的源文本-譯文本,可通過數(shù)據(jù)庫讀取。面向文本,先分句處理,切分源文本與已翻譯目標文本為短語。在翻譯時切分文本遵循切分為最簡短語言片段的原則,而在校對時文本需切分為短語。英文文本的空格為自然分隔符號,所以不需分詞處理,只需對中文分句文本進行分詞處理既可。中文分詞方式各式各樣,本文選擇基于最大熵模型的中文分詞模式。文本分詞之后,針對命名實體識別可解析出名詞或短語,以此信息作為英漢詞匯對齊的錨點。同時面向文本標注詞性,以便于識別出形容詞與數(shù)詞等成分,其中數(shù)詞作為文本片段的關(guān)鍵信息,實現(xiàn)英漢詞匯對齊;形容詞與副詞是豐富短語片段情感色彩的重要載體,也是英漢詞匯對齊的重要標志。

  在文本片段完成以上處理之后,成為已劃分詞邊界,且詞匯、短語已通過命名實體識別與詞性標注的短語片段集,然后開始提出短語特征,以實現(xiàn)英漢詞匯對齊。短語特征提取流程具體如圖1所示。

  就英漢短語而言,根據(jù)以上流程進行特征信息提取,并采用數(shù)字化形式加以描述。英漢雙語詞匯對齊時,通過面向各維度增加權(quán)重的方式,計算獲取英漢短語的距離,基于動態(tài)規(guī)劃法對短語距離進行評價,以此把短語最小距離的英漢對齊模型作為最終對齊結(jié)果。以尋找源文本與目標文件間對齊的短語,發(fā)現(xiàn)可能會存在的不一致性表達,即翻譯時的編輯性錯誤或者漏譯等,以實現(xiàn)錯誤智能檢測。

  自下向上的校對模塊體系結(jié)構(gòu)具體如圖2所示。

  4基于最大熵模型的分詞模式

  通過最大熵模型分詞,本質(zhì)在于最大熵模型的分類問題。將文本分詞問題轉(zhuǎn)變?yōu)轫槾螔呙枳址趻呙枳址笫欠穹衷~或是否到達到詞邊界問題。就詞問題而言,可將最大熵模型輸出明確為兩類,即掃描的位置不是詞邊界,不進行切分,繼續(xù)掃描;掃描的位置是詞邊界,進行切分。掃描的字符后續(xù)是否需要切分,直接受已出現(xiàn)的,特別是相鄰字符的影響。

  最大熵模型問題是求解基于約束條件可促使熵函數(shù)達到最大的隨機變量概率值,則:

  T(S)代表熵函數(shù);R,(t)代表隨機變量分布理論期望值;R.(t)代表基于約束條件的期望估計值。通過拉格朗日乘子法求解最優(yōu)解問題的數(shù)學描述,引進了向量參數(shù),以調(diào)節(jié)特征函數(shù),即約束條件作用強弱。一般情況下,明確向量參數(shù)的算法主要是GIS算法與改進IIS算法。通過測試最大熵模型,明確向量參數(shù),并運用到未處理文本,可確定中文字符邊界,從而實現(xiàn)中文分詞"。

  5計算機智能校對代碼的實現(xiàn)

  基于最大熵模型的分詞模式算法相應(yīng)的偽代碼,即:

  6測試分析

  為了進一步測試基于短語翻譯模型的英語翻譯計算機智能校對方法的有效性,進行英語翻譯校對測試分析,詳細記錄測試數(shù)據(jù)信息,以評估此方法有效性。在測試過程中,選擇800字符校對詞匯,1000篇校對短文,其中校對與識別速率分別為15Kb/s,、20Kb/s,基于此測試集比較分析英語翻譯結(jié)果校對前后的準確率,對比結(jié)果具體M如圖3所示。

  由圖可知,英語翻譯結(jié)果校對之前準確率最高只能達到72.9%,而通過英語翻譯計算機智能校對方法完成校對之后,準確率全部保持于99.0%以上,二者準確率差異顯著,這就表明本文提出的英語翻譯計算機智能校對方法具有顯著有效性與穩(wěn)定性。而就英語翻譯準確率均值可以看出,在校對之前,翻譯結(jié)果準確率均值只達到70.0%,而引進英語翻譯計算機智能校對方法之后,翻譯結(jié)果準確率均值高達99.4%,提高了29.4%,進一步證明了基于短語翻譯模型的英語翻譯計算機智能校對方法的有效性。

  7結(jié)束語

  綜上所述,本文提出了基于短語翻譯模型的英語翻譯計算機智能校對方法。通過測試表明,英語翻譯結(jié)果校對之前準確率相對偏低,而通過英語翻譯計算機智能校對方法完成校對之后,準確率明顯較高,二者準確率差異顯著,說明基于短語翻譯模型的英語翻譯計算機智能校對方法具有顯著有效性與良好穩(wěn)定性;就英語翻譯準確率均值而言,在校對之前,翻譯結(jié)果準確率均值只達到70.0%,而引進英語翻譯計算機智能校對方法之后,翻譯結(jié)果準確率提高了29.4%,進而說明了本文提出的英語翻譯計算機智能校對方法的有效性。

  參考文獻:

  [1]衛(wèi)娜,英語翻譯軟件視角下的翻譯改正算法研究1J.現(xiàn)代科學儀器,2019(3):15-18.

  [2]黃登嫻,英語翻譯軟件翻譯準確性矯正算法設(shè)計[J].現(xiàn)代電子技術(shù),2018,41(14):170-172,177.

  [3]湘南學院,英語翻譯交流學習臺:CN201720646432.9P].2018-07-17.

  [4]蘇傳捷,侯宏旭,楊萍,等,基于統(tǒng)計翻譯框架的蒙古文自動拼寫校對方法J.中文報,2013,27(6):175-179.

  [5]劉練.基于WebTM的輔助翻譯工具校對子系統(tǒng)設(shè)計與實現(xiàn)D].南京:東南大學,2017.

  [6]姜贏,李金威,謝湘貴,等,面向機器翻譯的假朋友語義自動校對[].電子設(shè)計工程,2017,25(11):222-26.

  [7]崔丹.英語翻譯計算機智能校對系統(tǒng)設(shè)計[J].現(xiàn)代電子技術(shù),2019,42(4):179-182,186.

  [8]薛鑫·基于機器翻譯模型的漢語近音錯別字校對方法研究D].哈爾濱:黑龍江大學,2017.

期刊VIP網(wǎng),您身邊的高端學術(shù)顧問

文章名稱: 基于短語翻譯模型的英語翻譯計算機智能校對方法

文章地址: http://www.ke-jian.com/mianfeiwx/57832.html

國際期刊論文 SCI/SSCI選題匹配!

選擇豐富服務(wù)快速通過率高一鍵快速領(lǐng)取私人專屬發(fā)表方案!

* 填寫需求信息,或選擇平臺現(xiàn)有SCI/SSCI選題(如下)。

主站蜘蛛池模板: 武威市| 南投县| 邵东县| 白水县| 濉溪县| 汝阳县| 宜黄县| 大石桥市| 海门市| 松溪县| 墨玉县| 松潘县| 北安市| 汉阴县| 尉犁县| 合江县| 察雅县| 阳东县| 博野县| 呼伦贝尔市| 柏乡县| 龙井市| 咸阳市| 峨山| 靖州| 胶州市| 龙南县| 石城县| 竹北市| 双牌县| 开封县| 屏山县| 五大连池市| 西安市| 泉州市| 洛宁县| 乐山市| 贵州省| 婺源县| 曲阜市| 汝州市|