日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) >

计算机语言史话论文,【论文节选】自然语言处理发展历史。

發(fā)布時(shí)間:2025/3/11 54 豆豆
生活随笔 收集整理的這篇文章主要介紹了 计算机语言史话论文,【论文节选】自然语言处理发展历史。 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

說(shuō)實(shí)話(huà)看完文章有點(diǎn)失望,作者帶有一貫的學(xué)術(shù)吹噓風(fēng),就像吹噓云計(jì)算,物聯(lián)網(wǎng)等等。談到現(xiàn)狀,只字不提問(wèn)題,一句話(huà)“一旦自然語(yǔ)言處理的研究獲得成功,那么機(jī)器將能夠進(jìn)行思考,人類(lèi)將得到繼工業(yè)革命后的又一次解放。不同的是工業(yè)革命解放了人類(lèi)的身體,而自然語(yǔ)言處理將解放人類(lèi)的大腦。”您在寫(xiě)YY小說(shuō)啊?

沒(méi)有認(rèn)識(shí)到未來(lái)需要解決的問(wèn)題,就不可能走下去。期待未來(lái)真有大牛研究出來(lái)吧。

下面是節(jié)選的歷史。沒(méi)什么實(shí)際意義,就是給自己掃盲而已。

1.什么是自然語(yǔ)言處理

自然語(yǔ)言處理(Natural?Language?Processing,?NLP)是一種對(duì)自然語(yǔ)言信息進(jìn)行處理的技術(shù)[4],從語(yǔ)言學(xué)的角度來(lái)說(shuō),自然語(yǔ)言處理也叫計(jì)算語(yǔ)言學(xué)(Computational?Linguistics)。自然語(yǔ)言處理包括自然語(yǔ)言理解(Natural?Language?Understanding,?NLU)和自然語(yǔ)言生成(Natural?Language?Generation,?NLG)兩部分。自然語(yǔ)言理解是指對(duì)自然語(yǔ)言的內(nèi)容和意圖的深層把握。在人工智能領(lǐng)域中,自然語(yǔ)言理解特指計(jì)算機(jī)對(duì)自然語(yǔ)言的內(nèi)容和意圖的深層把握。自然語(yǔ)言生成是指從非自然語(yǔ)言輸入到自然語(yǔ)言輸出的處理。自然語(yǔ)言理解與自然語(yǔ)言生成互為逆過(guò)程[5]。圖1簡(jiǎn)單地表示了自然語(yǔ)言處理、自然語(yǔ)言理解和自然語(yǔ)言生成三者之間的關(guān)系。其中,語(yǔ)言A和語(yǔ)言B可以是相同的語(yǔ)言,也可以是不同的語(yǔ)言。當(dāng)語(yǔ)言A和語(yǔ)言B是相同的語(yǔ)言時(shí),整個(gè)過(guò)程表示為聊天式交流;而當(dāng)語(yǔ)言A和語(yǔ)言B是不同的語(yǔ)言時(shí),整個(gè)過(guò)程則表示為機(jī)器翻譯式交流。

2.發(fā)展概況

自然語(yǔ)言處理的發(fā)展大致經(jīng)歷了4個(gè)階段:1956年以前的萌芽期;1957-1970年的快速發(fā)展期;1971?-1993年的低谷的發(fā)展期和1994年至今的復(fù)蘇融合期。

2.1萌芽期(1956年以前)

1956年以前,可以看作自然語(yǔ)言處理的基礎(chǔ)研究階段。一方面,人類(lèi)文明經(jīng)過(guò)了幾千年的發(fā)展,積累了大量的數(shù)學(xué)、語(yǔ)言學(xué)和物理學(xué)知識(shí)。這些知識(shí)不僅是計(jì)算機(jī)誕生的必要條件,同時(shí)也是自然語(yǔ)言處理的理論基礎(chǔ)。另一方面,阿蘭·圖靈在1936年首次提出了“圖靈機(jī)”的概念。“圖靈機(jī)”作為計(jì)算機(jī)的理論基礎(chǔ),促使了1946年電子計(jì)算機(jī)的誕生。而電子計(jì)算機(jī)的誕生又為機(jī)器翻譯和隨后的自然語(yǔ)言處理提供了物質(zhì)基礎(chǔ)。

由于來(lái)自機(jī)器翻譯的社會(huì)需求,這一時(shí)期也進(jìn)行了許多自然語(yǔ)言處理的基礎(chǔ)研究。1948年Shannon把離散馬爾可夫過(guò)程的概率模型應(yīng)用于描述語(yǔ)言的自動(dòng)機(jī)。接著,他又把熱力學(xué)中“熵”(entropy)的概念引用于語(yǔ)言處理的概率算法中。上世紀(jì)50年代初,Kleene研究了有限自動(dòng)機(jī)和正則表達(dá)式。1956年,Chomsky又提出了上下文無(wú)關(guān)語(yǔ)法,并把它運(yùn)用到自然語(yǔ)言處理中。他們的工作直接引起了基于規(guī)則和基于概率這兩種不同的自然語(yǔ)言處理技術(shù)的產(chǎn)生。而這兩種不同的自然語(yǔ)言處理方法,又引發(fā)了數(shù)十年有關(guān)基于規(guī)則方法和基于概率方法孰優(yōu)孰劣的爭(zhēng)執(zhí)。

另外,這一時(shí)期還取得了一些令人矚目的研究成果。比如,1946年K?enig進(jìn)行了關(guān)于聲譜的研究。1952年Bell實(shí)驗(yàn)室語(yǔ)音識(shí)別系統(tǒng)的研究。1956年人工智能的誕生為自然語(yǔ)言處理翻開(kāi)了新的篇章。這些研究成果在后來(lái)的數(shù)十年中逐步與自然語(yǔ)言處理中的其他技術(shù)相結(jié)合。這種結(jié)合既豐富了自然語(yǔ)言處理的技術(shù)手段,同時(shí)也拓寬了自然語(yǔ)言處理的社會(huì)應(yīng)用面。

2.2快速發(fā)展期(1957-1970)

自然語(yǔ)言處理在這一時(shí)期很快融入了人工智能的研究領(lǐng)域中。由于有基于規(guī)則和基于概率這兩種不同方法的存在,自然語(yǔ)言處理的研究在這一時(shí)期分為了兩大陣營(yíng)。一個(gè)是基于規(guī)則方法的符號(hào)派(symbolic),另一個(gè)是采用概率方法的隨機(jī)派(stochastic)。

這一時(shí)期,兩種方法的研究都取得了長(zhǎng)足的發(fā)展。從50年代中期開(kāi)始到60年代中期,以Chomsky為代表的符號(hào)派學(xué)者開(kāi)始了形式語(yǔ)言理論和生成句法的研究,60年代末又進(jìn)行了形式邏輯系統(tǒng)的研究。而隨機(jī)派學(xué)者采用基于貝葉斯方法的統(tǒng)計(jì)學(xué)研究方法,在這一時(shí)期也取得了很大的進(jìn)步。但由于在人工智能領(lǐng)域中,這一時(shí)期多數(shù)學(xué)者注重研究推理和邏輯問(wèn)題,只有少數(shù)來(lái)自統(tǒng)計(jì)學(xué)專(zhuān)業(yè)和電子專(zhuān)業(yè)的學(xué)者在研究基于概率的統(tǒng)計(jì)方法和神經(jīng)網(wǎng)絡(luò),所

以,在這一時(shí)期中,基于規(guī)則方法的研究勢(shì)頭明顯強(qiáng)于基于概率方法的研究勢(shì)頭。

這一時(shí)期的重要研究成果包括1959年賓夕法尼亞大學(xué)研制成功的TDAP系統(tǒng),布朗美國(guó)英語(yǔ)語(yǔ)料庫(kù)的建立等。1967年美國(guó)心理學(xué)家Neisser提出認(rèn)知心理學(xué)的概念,直接把自然語(yǔ)言處理與人類(lèi)的認(rèn)知聯(lián)系起來(lái)了。

2.3低速的發(fā)展期(1971?-1993)

隨著研究的深入,由于人們看到基于自然語(yǔ)言處理的應(yīng)用并不能在短時(shí)間內(nèi)得到解決,而一連串的新問(wèn)題又不斷地涌現(xiàn),于是,許多人對(duì)自然語(yǔ)言處理的研究喪失了信心。從70年代開(kāi)始,自然語(yǔ)言處理的研究進(jìn)入了低谷時(shí)期。

但盡管如此,一些發(fā)達(dá)國(guó)家的研究人員依舊不依不撓地繼續(xù)著他們的研究。由于他們的出色工作,自然語(yǔ)言處理在這一低谷時(shí)期同樣取得了一些成果。70年代,基于隱馬爾可夫模型(Hidden?Markov?Model,?HMM)的統(tǒng)計(jì)方法在語(yǔ)音識(shí)別領(lǐng)域獲得成功。80年代初,話(huà)語(yǔ)分析(Discourse?Analysis)也取得了重大進(jìn)展。之后,由于自然語(yǔ)言處理研究者對(duì)于過(guò)去的研究進(jìn)行了反思,有限狀態(tài)模型和經(jīng)驗(yàn)主義研究方法也開(kāi)始復(fù)蘇。

2.4復(fù)蘇融合期(1994年至今)

90年代中期以后,有兩件事從根本上促進(jìn)了自然語(yǔ)言處理研究的復(fù)蘇與發(fā)展。一件事是90年代中期以來(lái),計(jì)算機(jī)的速度和存儲(chǔ)量大幅增加,為自然語(yǔ)言處理改善了物質(zhì)基礎(chǔ),使得語(yǔ)音和語(yǔ)言處理的商品化開(kāi)發(fā)成為可能;另一件事是1994年Internet商業(yè)化和同期網(wǎng)絡(luò)技術(shù)的發(fā)展使得基于自然語(yǔ)言的信息檢索和信息抽取的需求變得更加突出。這樣,自然語(yǔ)言處理的社會(huì)需求更加迫切,自然語(yǔ)言處理的應(yīng)用面也更加寬廣,自然語(yǔ)言處理不再局限于機(jī)器翻譯、語(yǔ)音控制等早期研究領(lǐng)域了。

從90年代末到21世紀(jì)初,人們逐漸認(rèn)識(shí)到,僅用基于規(guī)則的方法或僅用基于統(tǒng)計(jì)的方法都是無(wú)法成功進(jìn)行自然語(yǔ)言處理的。基于統(tǒng)計(jì)、基于實(shí)例和基于規(guī)則的語(yǔ)料庫(kù)技術(shù)在這一時(shí)期開(kāi)始蓬勃發(fā)展,各種處理技術(shù)開(kāi)始融合,自然語(yǔ)言處理的研究又開(kāi)始興旺起來(lái)。

總結(jié)

以上是生活随笔為你收集整理的计算机语言史话论文,【论文节选】自然语言处理发展历史。的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。