所谓语音合成 是计算机根据语言学,计算语言学完整1
計算語言學(xué)
第一節(jié)計算語言學(xué)概說
概念:
計算語言學(xué)(computational linguistics)是用計算機研究和處理自然語言的一門新興邊緣學(xué)科。涉及語言學(xué)、計算機科學(xué)、數(shù)學(xué)等多個領(lǐng)域。旨在通過建立形式化的數(shù)學(xué)模型,來分析處理自然語言,并在計算機上用程序來實現(xiàn)分析和處理的過程。從而實現(xiàn)機器模擬人的部分乃至全部語言能力。
研究對象
自然語言&計算機處理(或者簡單地說“計算”)
自然語言:指日常生活中人們所使用的語言,如漢語、英語、法語等。
自然語言的特性和規(guī)則是計算語言學(xué)研究的主體。計算語言學(xué)不僅要研究自然語言的書寫系統(tǒng)(文字)還要研究自然語言的各級語言單位(音素、音位、語素、詞、短語、句子等)的組合規(guī)則和這些語言單位與語義產(chǎn)生聯(lián)系的各種規(guī)則【這是我們研究計算語言學(xué)的基礎(chǔ),初步工作】(目的:要讓計算機能自動理解和產(chǎn)生自然語言)
計算機處理:用計算機所能接受的方式來描寫和刻畫自然語言并把它表示在計算機中。(計算機是以數(shù)值處理的方式來處理信息的,它以二進(jìn)制數(shù)0和1為基本的操作符號,在此基礎(chǔ)上建立起一整套形式化處理的方法來進(jìn)行運轉(zhuǎn)。因此要讓計算機能夠理解和生成自然語言,自然語言的特性和每一條規(guī)則必須要以形式化的方式表示出來。自然語言的規(guī)則是錯綜復(fù)雜的,而且規(guī)則的數(shù)量也非常多。有了自然語言各種規(guī)則的形式化表示,并不能保證計算機就能夠正確有效地理解和產(chǎn)生自然語言,要想讓計算機能夠正確有效地處理自然語言,還需要研究自然語言規(guī)則之間的關(guān)系及其處理策略,并且也要用形式化的方式表示出來。)有了自然語言和計算機處理的研究基礎(chǔ),人們才能夠選擇計算機程序設(shè)計語言來設(shè)計和編寫處理自然語言的軟件程序,才能最終實現(xiàn)自然語言計算機處理的目的。
整個過程包括四部分:
知識挖掘
涉及語言學(xué)的眾多理論問題,
首先是語言觀問題,然后是語言研究的方法論問題;
形式表示
算法設(shè)計
更多涉及語言處理的實際工程問題
軟件編制
知識挖掘即從語言學(xué)角度提出自然語言處理的語言問題和理論
形式表示即把需要研究的問題在語言學(xué)上形式化,使之能以一定的數(shù)學(xué)形式嚴(yán)密規(guī)整地表示出來
算法設(shè)計即把這種嚴(yán)密而規(guī)整的數(shù)學(xué)形式表示為算法,使之能在計算機上形式化
軟件編制即根據(jù)算法編寫計算機程序,使之在計算機上能得以實現(xiàn)
計算語言學(xué)性質(zhì)
計算語言學(xué)是一門交叉性的學(xué)科,它是由語言學(xué)和計算機科學(xué)相互交叉要有語言學(xué)的知識,又要有計算機科學(xué)的知識。涉及語言學(xué)、計算機科學(xué)、數(shù)學(xué)等多個領(lǐng)域。
語言,這種我們習(xí)以為常的社會現(xiàn)象,人們可以從不同的角度來加以認(rèn)識,而研究目標(biāo)
總結(jié)
以上是生活随笔為你收集整理的所谓语音合成 是计算机根据语言学,计算语言学完整1的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [转]JS Cookie 中文乱码
- 下一篇: cmd命令行设置环境变量