机器翻译市场需求调研报告
????????????? ????機器翻譯市場需求調研報告
該文章屬原創,如轉載請于作者聯系!
王文峰? 劉鳴洋
1 機器翻譯的現狀
1.1機器翻譯及其發展歷程
機器翻譯(machine translation),又稱自動化翻譯,是利用計算機把一種自然語言轉變成另一種自然語言的過程。用以完成這一過程的軟件叫做機器翻譯系統。是一種高級的人工智能技術, 它是計算機科學、數學和語言學等多學科共同參與研制的結晶。機器翻譯之所以成為可能,一是因為兩種語言之間存在著可譯性,二是因為人的翻譯過程具有可模擬性。
機器翻譯并不是一個簡單的過程。它并不僅僅是選定文本的各個單詞的翻譯而是用目標語言把給定的句子或文本的所有單詞都進行翻譯,以達到對整篇文章的理解。自然語言根據各自的形態學,語法結構和語義學分成不同的語言,并且這些語言還包含了很多的模糊性。(所以機器翻譯很難達到一個理想的程度)
最早的機器翻譯起源于1933年,蘇聯人P.P.特羅絳斯基提出借助機器進行翻譯的詳細步驟,并設計出由一條帶和一塊臺板依靠機械原理進行翻譯工作的樣機。1954年,美國喬治敦大學和國際商用機器公司(IBM)首次聯合試驗使用電腦機譯系統,將250個詞的俄文材料譯成英文,這次試驗的成功標志著機器翻譯系統的真正誕生。
從20世紀60年代中后期到整個70年代,整個機器翻譯領域處于一個相對平穩發展的時期,而在某些國家,特別是加拿大和歐盟,機器翻譯的研究卻取得了比較顯著的進步。尤其是在加拿大,由于雙語文化的影響,政府積極支持機器翻譯的研發工作,1976年,加拿大蒙特利爾大學與加拿大聯邦政府翻譯局聯合開發了提供天氣預報服務的實用性機器翻譯系統TAUM-METEO,該系統的成功開發標志著機器翻譯已經在某些領域達到了實用化的程度。 進入20世紀80年代以來,由于計算機科學、語言學研究的發展,特別是計算機硬件技術的大幅度提高以及人工智能在自然語言處理上的應用,機器翻譯在全世界范圍內開始復蘇,并在隨后的90年代取得了長足的進步。
我國從1956年也開始了機器翻譯的研究,在“六五”、“七五”、“八五”和高技術研究發展計劃(863計劃)期間國家均把機器翻譯列入重點發展項目。早期機器翻譯主要以研究機構的學術開發為主,到了1992年,我國邁出了機器翻譯軟件商品化的步伐。中國軟件與技術服務股份有限公司(以下簡稱“中軟公司”)在 JFYⅢ翻譯系統之上成功推出了“譯星”1號軟件產品,從而帶動我國機器翻譯進入了一個發展熱潮期。
?
1.2機器翻譯的方法
機器翻譯領域的的研究方法基本上可以分為兩大類,即基于規則(Rule-Based)和基于語料庫(Corpus-Based)的方法。基于規則的方法又可以分為基于轉換的方法和基于中間語言的方法,基于語料庫的方法又可以分為基于統計的方法和基于實例的方法。傳統的基于規則的方法又可以稱為理性主義方法,與之相對,基于語料庫的方法又可以稱為經驗主義方法。
基于規則的方法:機器翻譯的主流方法一直是基于規則的方法。國際上有影響的機器翻譯系統基本上都需要規則的貢獻,即使在多種技術并存的系統中也有規則,基于規則的機器翻譯技術思想是被普遍接受的、成熟的,也是到目前為止應用最廣的方法。其優勢在于可以很準確的描述語言的特征規律,符合理性思維。但是,語言規則的產生需要大量的人力,而且大量的語言規則直接往往存在著不可避免的沖突。另外,規則方法在保證規則的完備性和適應性方面也存在著不足。
基于統計的方法:基本思想是,把機器翻譯看成是一個信息傳輸的過程,用一種信道模型對機器翻譯進行解釋。它為我們提供了很好的從已有的語言資源中自動得到我們所需要的語言信息的工具。基于統計的方法不需要依賴大量知識,直接靠統計結果進行歧義消解處理和譯文的選擇,避開了語言理解的諸多難題,但是語料的選擇和處理工程量巨大,而且存在著數據稀疏問題。因此通用領域的機器翻譯系統很少以統計方法為主。,
?? 基于實例的方法:其基本思想是,在已有的源語言實例句庫中,待翻譯句子按照類比原理匹配出最相似的實例句,取出實例句對應的目標語句子,進行適當的改造,最終取得待翻譯句子所相應的目標語句子。其特點是不需要對源語言進行任何的分析,僅僅是通過類比進行翻譯。基于實例的機器翻譯對于相同或相似的文本的翻譯有非常顯著的效果,隨著例句庫規模的增加,其作用也越來越顯著。對于實例庫中已有的文本,可以直接獲得高質量的翻譯結果。對與實例庫中存在的實例十分相似的文本,可以通過類比推理,并對翻譯結果進行少量的修改,構造近似的翻譯結果。但由于語料庫規模的限制,基于實例的機器翻譯很難達到較高的匹配率。因而到目前為止,還很少有機器翻譯系統采用純粹的基于實例的方法,一般都是把基于實例的機器翻譯作為多翻譯引擎中的一個,以提高翻譯的正確率。?
?機器翻譯除了上述三種主流方法之外,還有基于模式的、基于神經網絡的、基于對話的、基于原則的等等機器翻譯方法。
?
1.3 機器翻譯產品及現有水平(存在的問題)
總體上說,機器翻譯產品可以歸為如下幾類,一是傳統的文本自動翻譯產品;二是網頁翻譯,它常常與網上搜索引擎捆綁在一起;三是機器輔助翻譯產品,它主要是幫助專業翻譯人員提高翻譯效率;四是電子版的雙語詞典,如著名的金山詞霸,它主要是幫助熟悉外語的用戶在計算機上閱讀外語信息;五是口語自動翻譯。
基于個人的機器翻譯系統從1990年代初期開始出現,Systran Pro(專業版),Systran Classic(家庭版)環球銜接公司(Globalink)研制的Power Translator,語言工程公司(Language Engineering Corporation)研制的Logo Vista等,從大型機系統改造而來的有Systran Pro(專業版),Systran Classic(家庭版),Langescheidt(源自METAL)等,國內的系統有譯星、通譯、環宇通、華建譯通、東方快譯、金山譯霸等。
基于網絡的機器翻譯系統從1990年代中期開始大量出現,目前提供在線機器翻譯服務的知名公司有:Systran,Logos,Fujitsu,LANT,AltaVista,CompuServe以及國內著名的華建、桑夏等公司。
采取翻譯記憶(TM)技術的計算機輔助翻譯系統目前成為專業翻譯市場的首選,最為典型的是德國TRADOS公司的Translator’s Workbench和國內交大銘泰公司的雅信CAT等。
大規模的口語翻譯系統許多人多年的努力,將有為數眾多的口語翻譯的應用被作為小領域自然語言的應用,例如,數據庫的詢問(尤其是財政和股票市場數據),商業談判的相互交往,公司內部交流等等。
現今發達國家已開發出的文字翻譯機器,有日本理光公司推出的數字式翻譯復印機能逐字逐句地把英文譯成日文,每分鐘約?可翻譯半頁信紙打印稿,還可發送圖文傳真。
語音翻譯方面,日本ATR研究所、美國梅隆大學和德國西門子公?司共同研究,已于1993年試驗成功自動翻譯電話,并進行了10多分鐘對話。日本還研制成功一種通過計算機與?通信網絡連接的自動翻譯電話。此外,一種用5種語言(英、法、德意和西班牙)進行交談的語音翻譯機也已被推出,它內存有1萬個單詞,6.5萬個短語,發出的聲音標準、清晰、易懂。
最近美國又有公司推出一種旅游用的名為"WORLD?MATE"的袖珍翻譯機器,它準備了2250個常用短語(15種語言,每種各150個短語),幾乎能幫助你到世界各國旅游而不會發生語言障礙。?
可以看到,機器翻譯經過幾十年的發展,取得了很大的進展,特別是作為人們的輔助翻譯工具,機器翻譯已經得到大多數人的認可。但是,至今仍然沒有一個完善、實用、全面、高質量的自動翻譯系統出現。目前的機器翻譯還只是基于對語言的表層的句法分析,沒有對語言進行深層的語義分析,缺乏對自然語言的深入認識,因此翻譯結果很難達到預期的目標。
機器翻譯存在的主要問題:
l???????? 一句一句處理,上下文缺乏聯系;
l???????? 對源語言的分析只是求解句法關系,完全不是意義上的理解;
l???????? 缺乏領域知識,從計算機到醫學,從化工到法律都通用,就換專業詞典;
l???????? 譯文轉換是基于源語言的句法結構的,受源語言的句法結構的束縛;
l???????? 翻譯只是句法結構的和詞匯的機械對應
?
2 機器翻譯的需求與用戶分析
2.1基本需求
第一種傳統型,它要求翻譯結果和人(翻譯家)翻得一樣好,即翻譯結果達到出版水平;第二種需求對翻譯質量的要求稍低一些,尤其是對文體的要求較低,用戶這時最感興趣的是了解某篇文章的基本內容,因此希望翻譯速度越快越好;第三種需求是對話雙方一對一的交談(打電話或者在Internet聊天室里聊天)或無需寫在紙上的演講(如外交場合的談話);第四種需求是在信息檢索、信息抽取、數據庫訪問等多語言系統里所需進行的翻譯。
? ???? 第一種機器翻譯需求是為了傳播思想。自機器翻譯系統出現之日起,這種需求可以說在某種程度上得到了滿足。然而,要想達到用戶需要的質量,機器翻譯輸出結果常常還需要由翻譯家修改或進行"后編輯"。在很多情況下,這些修改都是必需的,因此機器翻譯系統實際上只是產生了一個"草稿型"譯文。因為此時對翻譯質量要求不高。翻譯家不打算而且也很反感被要求"粗略"地翻譯科學技術資料。當一個人只是想大致了解一下某篇文章的內容,并不想知道該文的一切細節,而且他也并不討厭看到譯文文體拙劣、語法錯誤百出時,機器翻譯足可滿足這種需求。
第二種需求是為了了解信息而使用機器翻譯系統,這一需求實際上已經作為第一種需求的副產品得到了實現。既然機器翻譯系統尚不能直接產生高質量的譯文,因此用戶能從未經編輯的譯文中找出或猜出他們需要的東西也是很有幫助的,畢竟翻譯出一部分總比一點沒有翻譯要好。在這種情況下,盡管機器翻譯的譯文結果很糟糕,但隨著PC價格越來越低廉,這類機器翻譯系統的需求量也大大增加了。翻譯工作者會望而卻步,因為工作量太大,且重復度太高,而且還要保持術語的一致性。簡而言之,機器翻譯適合于處理大量的、重復度高的技術資料、軟件本地化手冊、實時天氣預報等資料,而人工翻譯在語言非重復性的復雜文本方面有著無可替代的作用。
第三種需求是以交流信息為目的的機器翻譯。由于信息更新速度很快,不可能由人來翻譯,用戶需要馬上得出翻譯結果以便傳達信息的基本內容。例如基于Internet的在線翻譯系統,它能實時進行翻譯,但翻譯質量難盡人意。有些機器翻譯系統目前正在探索,機器翻譯自然"地扮演自己的角色。另一種用于人際交流的機器翻譯系統是口語翻譯系統,它可以用在電話交談、商務會談等場合。目前有很多專家正在研發這類系統,其難點在于語音合成和自動翻譯。這一領域的研究盡管進展緩慢,但我們仍然可以希望將來在非常受限的領域里應用在線口語機器翻譯系統。但對個人信件來說,機器翻譯可能會用得越來越多。而對電子郵件、網絡頁面的信息提取以及基于計算機的信息服務來說,機器翻譯可能是唯一可行的解決方案。常用信息的訪問和發布對于一些具有重復性卻有效期較短的信息,如股票價格,天氣預報以及財務信息等,可以使用機器翻譯來完成。如,加拿大政府利用機器翻譯系統,將天氣報告內容從英語自動翻譯為法語。
第四種機器翻譯需求是信息訪問系統提出的。在這里,機器翻譯軟件被集成到一系列子系統中,這些子系統包括如下幾類數據庫的全文搜索和檢索系統,一般是科學、醫學和技術期刊雜志的電子版,或文獻信息檢索系統;從文本,特別是新聞報道中提取信息;對文本進行綜述的系統;查詢非文本數據庫系統。
目前,這方面有幾個項目正在歐洲進行,目的是使所有歐盟成員國都能訪問數據和信息源,無論用什么源語言。
2.2 機器翻譯用戶分類
根據以上需求,我們可以把翻譯軟件用戶分為普通用戶和專業用戶:針對普通用戶的翻譯軟件要為用戶提供計算機應用過程中的閱讀或寫作幫助,這類軟件的通用性較強,市場份額也較大;而針對專業用戶的翻譯軟件必須具有較強的專業適用性和語言分析功能。
普通用戶不希望使用相對復雜TM,不想自己創建翻譯數據庫;他們不需要計算百分之幾的準確率,只是想漢化一些非中文版的軟件,簡單翻譯一下外國網站,或者簡要了解一篇文章的大概意思,對于這類用戶,金山詞霸、東方快車、中軟譯星和華建等一類的MT軟件仍然是他們關心的對象。
專業用戶主要使用TM(Translation Memory,翻譯記憶),主要面向專業翻譯人員和機構設計,主要是起翻譯得輔助作用,其口號“相同的句子永遠不需要翻譯第二遍” 從而提高了工作效率。比較有名氣的雅信CAT、塔多思等。
?
?
????????????????????????????????????????????????????????????????????????????????????????????????????????
3 機器翻譯的市場分析
3.1機器翻譯市場總體概況
隨著科學技術的發展,計算機和網絡技術已經深入我們工作、生活的每一個方面。?而語言不通妨礙了因特網時代普通人之間的信息交流,同時也促進了軟件信息翻譯服務市場持續快速發展。目前,中國翻譯市場的年產值約為120億元人民幣,但去年中國翻譯服務市場的營業額尚不足2億元。很顯然,二者很不相稱。?翻譯軟件可以幫助人們實現無障礙溝通的夢想。預計到2010年,全球翻譯類軟件市場可達400億美元,對于所有翻譯件廠商來說,這絕對是一個巨大的成長空間和機會。中國加入世界貿易組織(WTO)后,國內外市場交流與融合步伐進一步加快,翻譯市場正以前所未有的速度迅猛發展。2008年北京奧運、2010年上海世博會的舉行更給翻譯市場帶來難得的發展機遇。據資料顯示,目前全球年翻譯產值超過130億美元,亞太地區占30%,中國市場約為127億人民幣。美國權威機構對世界翻譯市場的調查顯示,翻譯市場的規模將在2005年達到227億美元,而中國將達到200億元人民幣的銷售額。國內做機器翻譯比較好的公司有中軟譯星,華建集團,金山快譯。國外做的比較好的有systran、google在線翻譯、Babel Fish Translation、http://worldlingo.com/wl/translate 、http://www.systransoft.com/。
3.2市場上的機器翻譯軟件
目前國內的機器翻譯軟件主要有三大類:詞典翻譯類、漢化翻譯類和專業翻譯類。
詞典類翻譯軟件相當于一種電子詞典,它可以迅速查詢英文單詞或詞組的詞義,并提供單詞的發音,為用戶了解單詞或詞組含義提供了便利。這類軟件占主導地位的是金山軟件公司的《金山詞霸》。《金山詞霸》堪稱是多快好省的電子詞典,它可以迅速查詢英文單詞或詞組的詞義,并提供單詞的發音,為用戶了解單詞或詞組含義提供了極大的便利。
漢化翻譯軟件主要滿足用戶漢化英文軟件、英文網頁,實現對屏幕英文信息的了解和文章的初步翻譯等,對信息獲取、了解文章大意有實際作用。典型代表是北京實達銘泰公司開發的《東方快車2000》,它首先提出了“智能漢化”的概念,改變了過去“即時漢化”的不足,也使人們對翻譯軟件有了更新的認識,使翻譯軟件的輔助翻譯作用更加明顯。《東方快車 2000》為用戶提供了“智能漢化集成環境”,為不會英語或英語水平不高的人提供了“語言障礙的全面解決方案”,包括內碼轉換、動態漢化和電子詞典等,很好地滿足了用戶漢化英文軟件、英文網頁,實現對屏幕英文信息的了解和文章的初步翻譯等,對信息獲取、了解文章大意有相當實際的作用。
專業翻譯系統以譯星、雅信譯霸為代表,是面對專業或行業用戶的翻譯軟件。這類軟件具有傳統語法規則的翻譯內核,其自動翻譯的可讀性效果如何,一直是翻譯軟件企業的努力方向。在自動翻譯方面,譯星具有一定的優勢,但其專業翻譯的質量與人們的實用性還有很大差距,所以,在好長一段時間里,專業翻譯軟件一直處于徘徊不前的狀態。
?
預計到2005年,全球翻譯類軟件市場可達300億美元,對于所有翻譯軟件廠商來說,這絕對是一個巨大的成長空間和機會。而對于中國的翻譯軟件廠商來說,這是夢升騰的地方。
3.2 機器翻譯產品的應用
(1)、企業級市場:更大的蛋糕(企業版)
隨著中國與國際貿易往來、商務談判、交流合作的日益頻繁,翻譯軟件企業級市場前景應該是非常廣闊的,因為需要翻譯的東西越來越多,需求在迅速增長,企業如果還只是依據一己的力量來翻譯往來文件和信函,是遠遠不能適應和滿足需要的,甚至很可能會降低效率,貽誤商機。而且隨著人們正版意識的增強和政府扶持力度的加大,翻譯軟件企業級市場將不象一些人所斷言的那樣是個成熟產業和夕陽產品,而是醞釀著大發展的勃勃生機。軟件企業的發展方向,更多的是從單機產品走向企業應用和服務,從渠道競爭轉向創新競爭。確實,對于諸多翻譯軟件開發公司來說,更大和更有誘惑力的地方是企業級市場。這個市場非常大,競爭也相當激烈。翻譯解決方案靈活多樣,可幫助小型企業改進多語信息的管理方式,同時簡化員工、客戶和合作伙伴之間的通信。
對于小企業而言,要不斷努力提高效率和生產力,來理解和管理多語內容并與世界各地的客戶接洽。但因為單機軟件的利潤比較低,所以未來將以為企業和廠商提供翻譯解決方案為主要方向。能滿足中小型企業翻譯需求和預算能力的桌面產品,可提供可信賴的翻譯以幫助企業在當今多語市場中保持競爭力。為當今專業翻譯師設計的桌面產品,其中的語言及后期編輯工具包內容眾多,可創建并管理多語文檔以獲得最佳的翻譯品質。該服務器端翻譯產品可用于公司內部網、外部網或局域網,既能讓員工以獨立或協作方式翻譯、編輯和管理多語言文檔。基于服務器的即時聯機翻譯服務可對您的網站和應用程序本地化企業解決方案。當今,隨著發展節奏不斷加快和競爭日益加劇,各企業為謀求發展出路,紛紛將目光投向了國際市場,并制定了快速進入市場的戰略和應對客戶需求的一攬子計劃。毋庸置疑,語言在這其間扮演了重要角色。由于需要翻譯的信息量在不斷增加,因此創建、編輯、發布和維護多語言信息也需要投入更多的精力。一個企業的網站、技術文檔、知識庫、政策和其它信息倘若無法向遍布世界各地的員工、客戶和合作伙伴傳達或者他們無法理解,則這些信息就毫無價值可言。
(2) 個人和辦公室工作者(單機版)
主要為個人和辦公室工作者使用,主要特點是預算較低,快速翻譯文本、網頁、電子郵件等。突破語言障礙,快速翻譯個人文本、網頁, 消息價格也較為便宜,可以鑲入文本和INTERNET。文件、電子郵件、網頁、報表。在用戶詞典的基礎上可以自己增加專業詞條。
(3) 在線服務
網頁翻譯工具其實就是在線網頁翻譯服務的程序版本,它可以隨時將需要翻譯的內容翻譯為你所需要的語言。有了如此方便的工具,以后在瀏覽外文網站時就算不能完美理解其內容,但起碼也能大致明白其意思了。要使用網頁翻譯工具必須連接到互聯網。訪客可以用自己的母語來瀏覽網站。也可以選擇詞典,翻譯本地的文檔,翻譯網頁,也可以轉換為私有文件、網頁, 和純文本。 在幾秒鐘內, 您的轉換被顯示在您的瀏覽器或被發送到電子郵件。也可以選擇詞典,翻譯本地的文檔,翻譯網頁,全球每天40萬人使用在線服務,多語種交互,已建成投付使用的機器翻譯解答系統。此系統可以直接把她們的翻譯按鈕鑲入自己的網站。為了滿足日益增長的即時多語信息需求,為個人和各類企業提供網頁、書面文本和 Microsoft Office 文件的隨選翻譯服務。這些訂購用戶可為其客戶、雇員及網站訪客提供服務,即無需安裝其他軟件即可在個人電腦上將信息實時翻譯成多種語言。聯機服務以高容量服務器網絡為依托,提供低成本高效益、服務于客戶的翻譯解決方案。您可通過 Internet 訪問“聯機服務”,并且無需 IT 工作人員協助即可輕松設置在線服務選項。
(4) 網絡服務器版
網絡服務器是運行在Linux 、windows的一套可升級的客戶服務器軟件(其它Unix 平臺可利用) 。這種系統以及延伸的過濾器可以進行查尋、處理電子郵件、網上聊天等和包含HTML 和RTF 過濾的支持為XML 、SGML 和其它類型文件,包括翻譯記憶服務器、術語管理服務器、全球化流程管理服務器、全球化內容管理服務器。該服務器端翻譯產品可用于公司內部網、外部網或局域網,既能讓員工以獨立或協作方式翻譯、編輯和管理多語言文檔。該服務器端翻譯產品可用于公司內部網、外部網或局域網,既能讓員工以獨立或協作方式翻譯、編輯和管理多語言文檔。基于服務器的即時聯機翻譯服務可對您的網站和應用程序(如搜索工具)進行實時的多語言本地化。通過即時在線翻譯服務,用戶可實時翻譯您網站(或門戶)中的文本或網頁內容,使其成為用戶喜愛訪問的網站(或門戶)。通過即時聯機翻譯服務,您可用桌上型電腦實時翻譯純文本、網頁和個人文件。
(5) 網站和商品的多語化
確保您網站的所有訪客都能通過所提供的翻譯服務,選擇用其母語來讀取所需的網頁內容,包括搜索工具、電子商務平臺和其它服務。還可以聯機翻譯服務可對您的網站和應用程序(如搜索工具)進行實時的多語言本地化。
(6)客戶支持知識庫的本地化
公司是提供在線客戶支持還是通過內部知識庫提供客戶支持?提供多語支持信息和知識庫,有助于客戶實時獲取所需語言的產品支持。可與您的企業內容管理系統、數據庫或其它應用程序整合使用。
有數據顯示,去年中國翻譯服務市場的營業額尚不足2 億元。很顯然,這與飛速發展的中國市場是很不相稱的。隨著中國與國際貿易往來、商務談判、交流合作的日益頻繁,翻譯軟件企業級市場前景應該是非常廣闊的。
4 機器翻譯的前景預測
4.1機器翻譯軟件的未來需求
如何針對用戶需求,開發不同應用層次的翻譯軟件是軟件面臨的主要挑戰,用戶的需求是推動技術發展的原動力。
面臨挑戰的另一個應用領域是將用戶的輸入譯成用戶所知甚少或未知的外國語,這時用戶并不想充當雙語翻譯家的角色。機器翻譯系統可以給出大致"粗略"的譯文,至少可以告訴用戶大致說的是什么。但對那些不知道目標語言的翻譯,目前還沒有什么解決辦法。最近日本研制出一些廉價的產品,可以對特定的"外語授權(foreign language authoring)"提供服務。例如,寫一封商務信函(基于標準短語和文件模板),但對其他領域或較長的文件,因為"規矩套路"很少,所以還不能編寫。目前有幾個研究小組正在研究交互式系統,發送者按照模板要求編寫文檔,如果輸入文件足夠"正規化",機器翻譯系統就能保證語法和語言風格的正確輸出。
同樣,將機器翻譯技術與信息訪問、信息提取和文摘軟件結合在一起的嘗試也處于研究階段,目前市場上還沒有商用產品,但開發商已經意識到其潛在的市場。例如,AVENTINUS項目是專門為警察部隊在輯毒和執法方面開發的,用歐盟任何一種語言都可以訪問中央數據庫并查詢關于毒品、犯罪和嫌疑犯的信息。目前,世界各國對這類跨語言應用的興趣越來越大。最吸引人的應用是"跨語言信息檢索",即允許用戶用自己的語言搜索外語數據庫。在這一系統中,大部分工作集中于如何建立和操作合適的翻譯字典,以便將查詢詞串與數據庫文檔中的詞和詞組相匹配。相信在不久的將來會有這方面的商用軟件出現。
未來還有一種應用是公眾迫切需要的,這就是口語翻譯。但從商業角度或者研究角度看,全自動口語翻譯還是一件十分遙遠的事情。口語翻譯下一個10年可以預測發展最廣泛的是口語翻譯。目前的研究項目(ATR、C-STAR、JANUS、Verbmobil等等)都是在80年代末和90年代初開始的。實際應用在下個世紀前可能不現實。這些系統都限制在小領域中。不管期望值多么高,再用20年時間或更長,出現實用的,面向非受限領域的口語機器翻譯都是不可能的。比較實際的情況應該是受限領域的應用,比如財經和股票市場數據的查詢系統,商業談判的交互式系統,公司內部交際系統等等。 ?? 口語翻譯可能是目前機器翻譯研究中最富有創新意義的領域,吸引了最多的資金和公眾注意力。但觀察家們并不相信這一領域在近期能取得迅速進展,因為書面語機器翻譯花了數十年才達到現在的水平。口語翻譯方面的另一項努力始于1993年5月由德國科學技術部出資支持的VERBMOBIL項目。該項目的目標是開發一個便攜式商務談判的輔助工具,好幾所德國大學參與了這項對話語言學、言語識別和機器翻譯設計的基礎性研究工作。目前系統原型的開發已經接近尾聲,很快將有演示產品出現。
機器翻譯系統正在開拓新的領域:幫助需要用外語寫作的作家生成文章草稿、在線電視解說詞翻譯、翻譯數據庫信息等。中國GDP的持續增長,PC和手機用戶的增加,internet的高速發展,語言翻譯、手機翻譯、互聯網翻譯(電子郵件、跨語言的查找和搜索引擎結果的翻譯等等)、多語言寫作和生成技術等等的需求會持續增加。這樣,隨著市場和收費系統的完善,翻譯軟件的銷量會大幅度提高。
4.2 嵌入式讓翻譯軟件機器翻譯又一春
幾年前,翻譯軟件等面向個人的應用軟件在IT市場非常活躍。但由于盜版猖獗,這類軟件價格日益走低,軟件的嵌入式得出現,開辟了一個更大的市場。聽說某種嵌入式翻譯軟件品牌的人并不多,甚至很多它的使用者都不知道。為客戶持續地提供翻譯產品和翻譯服務,包括國際短信翻譯網關及其平臺、翻譯引擎、全文翻譯器、電子詞典、移動應用軟件開發、移動產品測試等。這就是嵌入式軟件的一個特點,它總是在幕后為用戶服務。在學習機、手機上、翻譯機、旅游機、智能手機、數字電視、以及汽車電子的嵌入式應用,是這次機遇中難遇的切入點;機遇與挑戰并存。
首先一個市場是數字電視市場。中國有8000萬戶有線電視網用戶、1億以上有線電話網用戶、3億多臺彩色電視機、7000多萬臺VCD/DVD機,據估計,未來十年是機頂盒的黃金時期,十年間總量可達到1~1.5億臺,總產量將達到600~1500億元人民幣。
第二個市場是移動通信市場。中國是全球第二大手機消費國,今年,中國手機的用戶將達到7000萬,據預計,明年,中國將成為全球第一大手機消費國;國內GSM手機定點廠家已達到14家,如果每個手機定點廠家的年產量達到100萬臺(盈利點),則總產量將達到1400萬臺。
第三個市場是掌上電腦(PDA)。計算機正在向微型化和專業化方向發展,PDA在5年內總銷量將達到3000萬臺,總產值達到300億元。
機器翻譯(整句翻譯)引擎還應用在電子詞典產品、學習機產品、手機等PDA產品,還可在學習機領域進行平臺的移植。隨著中外交流的發展,中國GDP的持續增長,PC和手機用戶的增加,internet的高速發展,語言翻譯、手機翻譯、互聯網翻譯(電子郵件、跨語言的查找和搜索引擎結果的翻譯等等)、多語言寫作和生成技術等等的需求會持續增加。這樣,隨著市場和收費系統的完善,翻譯軟件的銷量會大幅度提高。
5.對未來市場機器翻譯的一些看法
綜合以上分析,可以看出機器翻譯的市場前景極其廣闊,結合具體的調研談一下自己的看法。
(1)嵌入式軟件市場前景廣闊,目前市場上的機器翻譯軟件眾多,而且都有了一定的積累和客戶群。而國內開發的各種專業翻譯軟件,操作方便程度及翻譯準確性、可讀性都相差不大,翻譯機理大同小異。而嵌入式機器翻譯軟件是未來機器翻譯軟件的一個新的突破點。
(2)尋求合作,充分利用我們在自然處理方面的優勢和成果,與一些大的技術公司尋求合作,共同開發。以華建為例,與臺灣HTC(中文名稱為“宏達國際”)集團合作生產中文WinCE掌上電腦,為其提供嵌入式軟件,該電腦半年內銷量即達30多萬臺,產值達到10億元,成為世界銷量第一的中文WinCE產品。與中國電信、中國聯通、中國吉通、魯能集團等合作建設網站,并為其提供網絡集成平臺。
(3)應當把技術和應用相結合,關鍵是如何把現有資源利用起來。根據用戶需要的改變隨時改變自己的研究方向,同時也要學會培育市場,引導市場。
(4)任何一種軟件,只要能滿足某一部分人需求就是好東西。不能過于追求大而全,從技術上來說。以德國的TRADOS為例,它的成功并不僅僅是靠技術,而是其按專業定制,細分市場的營銷模式, 高端產品取決于軟件水平,而低端則取決于價格,做好低端市場是非常必要的。
由此可見,機器翻譯具有極其廣闊的應用前景。機器翻譯技術具有巨大的應用需求,隨著經濟全球化時代的到來,如何克服語言障礙已經成為國際社會共同面對的問題。可以說,多年來機器翻譯始終是國際學界、商界甚至軍界共同角逐的必爭之地。機器翻譯技術被列為21世紀世界十大科技難題的第一位。世界上各發達國家聚集各路高手,不惜以億萬重金投資,都試圖率先突破機譯的難關,搶占翻譯機器的巨大市場。
總結
以上是生活随笔為你收集整理的机器翻译市场需求调研报告的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SAP增强 BADI屏幕增强实例(MIG
- 下一篇: gardner环 matlab,【mat