日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

人工智能时代背景下,NLP方向或将悄悄崛起

發(fā)布時(shí)間:2024/10/8 95 豆豆
生活随笔 收集整理的這篇文章主要介紹了 人工智能时代背景下,NLP方向或将悄悄崛起 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

自然語言處理是目前人工智能領(lǐng)域內(nèi)的一個(gè)很重要的方向。它的目的是實(shí)現(xiàn)人和計(jì)算機(jī)程序之間使用自然語言(漢語、英語等語言)進(jìn)行有效通信。但是自然語言處理也不是單純地研究自然語言,而是集語言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)等多種學(xué)課為一體的領(lǐng)域。簡單來說,就是計(jì)算機(jī)接受來自輸入用戶自然語言形式的輸入,通過程序中存儲的算法對輸入?yún)?shù)進(jìn)行拆分計(jì)算等等操作,來達(dá)到類似人類理解語言的目的,并對處理結(jié)果進(jìn)行分析,針對性的返回期望的輸出結(jié)果。作為人工智能領(lǐng)域公認(rèn)的最高境界,自然語言處理(NLP)也被稱為“人工智能皇冠上的珍珠”。

1 自然語言處理(NLP)發(fā)展前景

首先來說,NLP屬于認(rèn)知智能,相對于圖像語音識別來說,其實(shí)現(xiàn)起來更加復(fù)雜和困難。這也是為何在人臉識別和語音輸入等功能逐漸完善的當(dāng)下,NLP方面還沒有什么成型可以商用的技術(shù)的原因。

而NLP算法的應(yīng)用場景有很多,像是對話系統(tǒng),翻譯系統(tǒng),圖像的多模態(tài)等等。目前國內(nèi)許多NLP方向的人才都被像BAT之流的大公司壟斷了。因此市面上的NLP方向人才較少。在此時(shí),趁著人工智能領(lǐng)域還有著較大人才缺口的時(shí)候,學(xué)習(xí)NLP相關(guān)算法,抓住時(shí)代帶來的機(jī)遇,可以說是一個(gè)不錯(cuò)的選擇。

不僅在就業(yè)方面,NLP方向大有可為,在學(xué)術(shù)方面,NLP作為人工智能完全的課題,其中很多的難點(diǎn)重點(diǎn)都還沒有解決。也很值得同學(xué)們?yōu)榇私K身奮斗。

2 如何學(xué)習(xí)NLP算法

知識結(jié)構(gòu)梳理

和大多數(shù)本科生在學(xué)校期間學(xué)習(xí)的爬蟲或者網(wǎng)站開發(fā)等技術(shù)向方向不同,想要很好地掌握NLP算法,需要我們掌握的知識量要大很多,對于其中包含的基礎(chǔ)知識及其分類,可以大概劃分如下:

面對如此大量的知識體系,我建議可以通過線上視頻課或者線下課程的形式,來系統(tǒng)完整地學(xué)習(xí)NLP算法。和其他編程算法不同,NLP算法設(shè)計(jì)的基礎(chǔ)知識較多。下面會(huì)對上述知識進(jìn)行分步介紹:

首先是基礎(chǔ)原理部分,這部分的知識以機(jī)器學(xué)習(xí)和深度學(xué)習(xí)為主,首先是機(jī)器學(xué)習(xí)部分。

相信對于理工科的同學(xué)來說,這些課程有部分是在學(xué)校內(nèi)學(xué)過的,但無論是學(xué)過還是沒學(xué)過的同學(xué),都可以著重看一下線性分類、支持向量機(jī)(SVM)、樹模型和圖模型這四方面的知識,作為深度學(xué)習(xí)的入門,這部分知識我們要熟練掌握。

接下來是深度學(xué)習(xí),在這部分中我們盡量先弄明白神經(jīng)網(wǎng)絡(luò)的正向和反向傳播過程,接下來了解其中的詞向量和編碼器解碼器的內(nèi)部構(gòu)造思想。可能之前有些同學(xué)使用過Word2vec或者其他,但這次我們要從內(nèi)到外的去學(xué)習(xí),在下圖中提到的神經(jīng)網(wǎng)絡(luò)類型都是比較重要的,還是希望同學(xué)們能夠好好掌握。

在有了以上的知識貯備后,我們可以著手開始學(xué)習(xí)模型結(jié)構(gòu)和論文了。下一步的任務(wù)是學(xué)習(xí)了解各種NLP經(jīng)典任務(wù)的Baseline,盡量地看懂源碼。

NLP的幾大經(jīng)典任務(wù)有:文本分類、文本匹配、序列標(biāo)注、文本生成、語言模型等。

像是NLP算法中最為常見的文本分類任務(wù),TextCNN可以說是第一Baseline,往后的發(fā)展就是加RNN、加Attention、用Transformer、用GNN了。第一次看可以對每個(gè)編碼器都粗略看一下,之后可以回過頭來仔細(xì)閱讀代碼。

在這里我推薦兩個(gè)我在學(xué)習(xí)過程中個(gè)人感覺講課效果很好的兩個(gè)網(wǎng)上公開課。

吳恩達(dá)CS229

吳恩達(dá)教授在斯坦福大學(xué)開設(shè)的機(jī)器學(xué)習(xí)課程CS229,可以說是很多人入門機(jī)器學(xué)習(xí)最先看到的課程了。這門當(dāng)時(shí)爆火的課程直到現(xiàn)在仍然是很經(jīng)典很有意義的機(jī)器學(xué)習(xí)課程之一。

在CS229中,吳恩達(dá)教授主要講授了機(jī)器學(xué)習(xí)和統(tǒng)計(jì)模式識別兩種內(nèi)容。和其他課程相比,這個(gè)課程由于是在大學(xué)中教授的課程,所以對于數(shù)學(xué)原理方面的講解要更多更深入一些。對于想要深入學(xué)習(xí)機(jī)器學(xué)習(xí)的同學(xué)來說是很不錯(cuò)的選擇。但是對于我這種想要直接應(yīng)用到工作中的人來說,這門課程的導(dǎo)向和我的需求不太相符。

吳恩達(dá)教授的課程在嗶哩嗶哩有很多,這里我就不放鏈接了,需要的小伙伴可以自己去搜索。

臺大李宏毅

臺大李宏毅教授的機(jī)器課程,也是在網(wǎng)絡(luò)上受眾廣泛的一套視頻課程。李教授的這門課程,包含了從機(jī)器學(xué)習(xí)入門到OpenCV,從人工智能到NLP算法在內(nèi)的許多內(nèi)容。李教授的講課風(fēng)格也深受同學(xué)們的喜歡。所以對于想要選擇視頻課的同學(xué)來說,可以跟著李教授進(jìn)行學(xué)習(xí)。但是李教授的視頻課程內(nèi)容極其豐富,倘若時(shí)間有限的話,需要選擇符合自己導(dǎo)向的課程進(jìn)行學(xué)習(xí)。

NLP算法的知識結(jié)構(gòu)十分復(fù)雜,我剛剛開始學(xué)習(xí)的時(shí)候也沒能立即上手,學(xué)習(xí)完基礎(chǔ)知識準(zhǔn)備進(jìn)入框架學(xué)習(xí)階段時(shí)發(fā)現(xiàn)遇到的問題實(shí)在太多了,這時(shí)我在網(wǎng)上看見了貪心科技推出的AI就業(yè)班,在這門課程的幫助下,我更好地完成了由理論到實(shí)踐的過程。

貪心科技AI就業(yè)班

在入門機(jī)器學(xué)習(xí)的時(shí)候,我所學(xué)習(xí)的就是貪心科技推出的機(jī)器學(xué)習(xí)中級課程。所以這次我再次回到貪心科技的官網(wǎng)查看,發(fā)現(xiàn)了這款A(yù)I就業(yè)班。

和一般的網(wǎng)絡(luò)視頻課不同,貪心科技的這款A(yù)I就業(yè)班有著明確的導(dǎo)向,也就是就業(yè)。

整個(gè)課程可以分為兩個(gè)階段,第一個(gè)階段是基礎(chǔ)知識的學(xué)習(xí)和案例實(shí)操;第二個(gè)階段是參與真實(shí)企業(yè)中的AI項(xiàng)目。

第一個(gè)階段又分為了三個(gè)部分,一是python語法基礎(chǔ)和數(shù)據(jù)分析基礎(chǔ)。作為NLP算法的最為基礎(chǔ)的知識,貪心科技的這款課程在一開始就進(jìn)行了重點(diǎn)的講解,不管是有沒有機(jī)器學(xué)習(xí)操作經(jīng)驗(yàn)的學(xué)生,都能夠聽懂這次課程并有所收獲。

在基礎(chǔ)知識學(xué)習(xí)之后,還配有兩個(gè)實(shí)際案例的詳細(xì)講解和一次陌生的案例實(shí)戰(zhàn)。確保同學(xué)們能夠完全掌握爬蟲和數(shù)據(jù)分析相關(guān)知識并能夠運(yùn)用到實(shí)際生活中去。

在掌握了爬蟲和數(shù)據(jù)分析相關(guān)知識后,就可以進(jìn)入下一個(gè)階段的學(xué)習(xí)了。那就是機(jī)器學(xué)習(xí)基礎(chǔ)。再這一部分中,貪心科技從多種回歸分析的理論部分入手,講解了包含決策樹和隨機(jī)森林的樹模型,以及包含神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等模型的聚類分析和神經(jīng)網(wǎng)絡(luò)。

在AI就業(yè)班課程的第三部分,也是最重要的部分,貪心科技的老師分了九大板塊,來介紹包括文本處理、搜索引擎技術(shù)、深度學(xué)習(xí)基礎(chǔ)、LSTM模型、Seq2seq模型、自注意力機(jī)制、關(guān)系抽取和模型壓縮等技術(shù)。之后也選取了多大九個(gè)經(jīng)典案例,來幫助同學(xué)們在實(shí)際操作中進(jìn)一步學(xué)習(xí)。

在下一個(gè)階段,也就是參與真實(shí)AI企業(yè)項(xiàng)目階段。這個(gè)階段也是我當(dāng)時(shí)收獲最大的階段。在這個(gè)階段,我們將會(huì)分組進(jìn)入到某一個(gè)項(xiàng)目組,具體進(jìn)入哪一個(gè)項(xiàng)目組取決于個(gè)人的職業(yè)發(fā)展方向以及當(dāng)時(shí)的項(xiàng)目的情況。比如今后想做對話系統(tǒng),我們可以選擇加入對話系統(tǒng)項(xiàng)目組;今后想做醫(yī)療知識圖譜,也可以選擇加入知識圖譜項(xiàng)目組。處于對科大訊飛的對話機(jī)器人的好奇,我加入了企業(yè)問答機(jī)器人項(xiàng)目組。

而這一階段的具體流傳如下圖所示。

在企業(yè)的實(shí)習(xí)過程中,我學(xué)到了在視頻課程中完全學(xué)習(xí)不到的內(nèi)容。在企業(yè)環(huán)境中進(jìn)行算法搭建,面對的是和平時(shí)自己操作時(shí)完全不同體量的數(shù)據(jù)。在企業(yè)真實(shí)的開發(fā)環(huán)境中,我能清楚地感受到自己的算法水平,有了非常快速的進(jìn)步。

而且和線上課程不同,在線下學(xué)習(xí)時(shí),有著一群志同道合的伙伴,在我學(xué)習(xí)累了的時(shí)候,他們伏案的背影成為了我繼續(xù)努力的動(dòng)力。我和線下班的同學(xué)們在課程結(jié)束后各自奔向了不同的企業(yè),可是這段一起拼搏學(xué)習(xí)的經(jīng)歷,成為了我們共同難忘的回憶。

對于沒有時(shí)間進(jìn)行線下學(xué)習(xí)的同學(xué)來說,也可以選擇線上視頻課的形式。在這里我簡單介紹一下我學(xué)習(xí)NLP算法的過程中所了解的幾種網(wǎng)上視頻課程吧。

3 書籍推薦

在學(xué)習(xí)人工智能的過程中,有本合適的參考書會(huì)使學(xué)習(xí)事半功倍。而對于內(nèi)容豐富的人工智能領(lǐng)域,有了參考書會(huì)對我們的學(xué)習(xí)產(chǎn)生很好的輔助作用。以下是我自己使用過的很不錯(cuò)的經(jīng)典書籍:

首先是周志華的《機(jī)器學(xué)習(xí)》,由于封面上的西瓜,這本書也被大家稱為西瓜書。

作為機(jī)器學(xué)習(xí)領(lǐng)域極其經(jīng)典的入門教材之一,這本書對機(jī)器學(xué)習(xí)的解釋可以稱得上是大而全面,是一本非常適合用來作為入門書籍的書。但是美中不足的是,書中對于公式的解釋并沒有其對于原理解釋地那樣細(xì)致。因此初學(xué)者可以選擇跳過其中部分難懂公式的講解,等有了一定基礎(chǔ)之后再回過頭來學(xué)習(xí)。

另一本書是數(shù)理知識方面的書籍,由李航編寫的統(tǒng)計(jì)方法學(xué)習(xí),可以算是對上書公式不足的補(bǔ)充。在這本書中,對于機(jī)器學(xué)習(xí)中的公式有著極其細(xì)致的推導(dǎo),看完這本書之后會(huì)對機(jī)器學(xué)習(xí)有著更深入的了解。

在有了機(jī)器學(xué)習(xí)和相應(yīng)的數(shù)理基礎(chǔ)后,可以學(xué)習(xí)這本《動(dòng)手學(xué)習(xí)深度學(xué)習(xí)》。和傳統(tǒng)的教材不同,這本書中不僅有著深度學(xué)習(xí)的算法原理和運(yùn)行過程,還有著可以下載并且運(yùn)行的Jupyter記事本。在書中,你可以看到文字、公式、代碼完美地融合在了一起,是我們學(xué)習(xí)深度學(xué)習(xí)路上不可多得的一本好書。

4 一點(diǎn)建議

不管我們在學(xué)習(xí)何種知識,都一定不要忘記我們是為了什么學(xué)習(xí)。我想大部分人學(xué)習(xí)深度學(xué)習(xí),都是為了之后就業(yè)有所幫助。那么在我們學(xué)習(xí)的過程中,就一定要牢記就業(yè)這個(gè)方向。單純的做題看視頻是遠(yuǎn)遠(yuǎn)不夠的,最有效、最快速的方法便是跟隨一個(gè)個(gè)項(xiàng)目來進(jìn)行實(shí)踐。

而網(wǎng)絡(luò)上能找到的項(xiàng)目資料,有的過于陳舊,沒有了參考價(jià)值;有的資料不全,做到一半沒法進(jìn)行下去。這時(shí)候我就不得不安利一下之前提到的貪心科技AI就業(yè)班了:

貪心學(xué)院有著實(shí)力雄厚的導(dǎo)師團(tuán)隊(duì),教研團(tuán)隊(duì)成員由亞馬遜、谷歌、微軟高級工程師構(gòu)成,擁有極強(qiáng)的理論基礎(chǔ)和商業(yè)實(shí)戰(zhàn)經(jīng)驗(yàn):

在這些老師的幫助下,我和同學(xué)們都迅速地提升著自己的專業(yè)水平,很快地成為了一名合格的NLP算法工程師。而且貪心科技AI就業(yè)班自從開班以來,歷屆學(xué)員的就業(yè)待遇是十分驚人的。平均18900的月薪已經(jīng)達(dá)到甚至超過了211大學(xué)本科畢業(yè)生的薪資,88%的就業(yè)班畢業(yè)生,都能找到在AI崗位的工作。如此華麗的就業(yè)數(shù)據(jù),是大部分輔導(dǎo)機(jī)構(gòu)難以望其項(xiàng)背的。

最后,能在貪心科技的AI就業(yè)班中和老師同學(xué)相遇,使我一生難忘的事情。在班級中結(jié)識的老師,也是我工作道路上的領(lǐng)路人和指引者。從我自身角度而言,貪心科技的這款A(yù)I就業(yè)課,真的是物超所值。

總結(jié)

以上是生活随笔為你收集整理的人工智能时代背景下,NLP方向或将悄悄崛起的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。