做这个AI项目面试通过率达95%
01
京東AI項(xiàng)目實(shí)戰(zhàn)教學(xué)
項(xiàng)目一
京東智能對話系統(tǒng)項(xiàng)目
項(xiàng)目簡介:智能客服機(jī)器人已經(jīng)成為了客服系統(tǒng)的重要組成部分,幫助人工客服提升工作效率,為企業(yè)降低人工成本。作為智能客服的行業(yè)先驅(qū),京東多年來致力打造全鏈路的客服機(jī)器人,最大化提升商家的接待效率和用戶體驗(yàn)。目前智能機(jī)器人的對話生成策略已經(jīng)在“京小智”、“京東JIMI“等智能客服機(jī)器廣泛應(yīng)用,在用戶購買商品的售前以及售后環(huán)節(jié),為數(shù)千萬用戶以及數(shù)十萬商家進(jìn)行服務(wù),為商家降本增效,為用戶提升購物客服體驗(yàn)。
項(xiàng)目二
京東智能營銷文本生成項(xiàng)目
項(xiàng)目簡介:在京東零售場景,數(shù)百萬的寫作達(dá)人每天為商品創(chuàng)作賣點(diǎn)突出、風(fēng)格多樣的營銷文案以促進(jìn)用戶下單,同時(shí)達(dá)人也會(huì)賺取傭金。但達(dá)人創(chuàng)業(yè)也會(huì)導(dǎo)致創(chuàng)作成本高、量產(chǎn)性差、質(zhì)量參差不齊的問題。目前京東AI營銷文案的人工審核通過率超過95%,并覆蓋了全品類的商品。模型已成功應(yīng)用于京東APP-發(fā)現(xiàn)好貨,對話機(jī)器人京小智和搭配購等場景。
項(xiàng)目三
京東同類商品競價(jià)搜索項(xiàng)目
項(xiàng)目簡介:當(dāng)商家上架或選擇新品時(shí),往往需要更全面了解產(chǎn)品性能參數(shù)等指標(biāo)對比,為便于幫助商戶的決策,京東提供了一款同類商品搜索功能產(chǎn)品;給定一個(gè)商品,它可以根據(jù)商品相關(guān)的信息去自動(dòng)找到網(wǎng)上的同類商品。這里的一個(gè)難點(diǎn)在于,每一個(gè)商品在網(wǎng)上的標(biāo)題、描述都有一些區(qū)別,所以定位到同一個(gè)商品本身具有一定的挑戰(zhàn)。
《京東NLP企業(yè)項(xiàng)目實(shí)戰(zhàn)訓(xùn)練營》
專注于培養(yǎng)行業(yè)TOP10%的NLP工程師
對課程有意向的同學(xué)
二維碼咨詢
????????????
02?
課程大綱
課程覆蓋了從經(jīng)典的機(jī)器學(xué)習(xí)、文本處理技術(shù)、序列模型、深度學(xué)習(xí)、預(yù)訓(xùn)練模型、知識(shí)圖譜、圖神經(jīng)網(wǎng)絡(luò)所有必要的技術(shù),30+項(xiàng)目案例幫助你在實(shí)戰(zhàn)中學(xué)習(xí)成長。5個(gè)月時(shí)間博導(dǎo)級(jí)大咖全程輔導(dǎo)答疑、幫你告別疑難困惑。
?第一部分:機(jī)器學(xué)習(xí)基礎(chǔ)篇
第1章:自然語言處理概述 什么是自然語言處理及現(xiàn)狀和前景 自然語言處理應(yīng)用 自然語言處理經(jīng)典任務(wù)及技 | 第2章:數(shù)據(jù)結(jié)構(gòu)與算法基礎(chǔ) 時(shí)間復(fù)雜度、空間復(fù)雜度 斐波那契數(shù)列的時(shí)間和空間復(fù)雜度 動(dòng)態(tài)規(guī)劃算法 經(jīng)典的DP問題 |
第3章:機(jī)器學(xué)習(xí)基礎(chǔ) - 邏輯回歸 分類問題以及邏輯回歸重要性 邏輯回歸的條件概率 最大似然估計(jì) 構(gòu)建邏輯回歸的目標(biāo)函數(shù) 優(yōu)化與梯度下降法 隨機(jī)梯度下降法 | 第4章:機(jī)器學(xué)習(xí)基礎(chǔ) - 模型的泛化 理解什么是過擬合 如何防止過擬合現(xiàn)象 L1與L2正則 交叉驗(yàn)證 L1正則與拉普拉斯分布 L2正則與高斯分布 |
?第二部分:文本處理篇
第5章:分詞、詞的標(biāo)準(zhǔn)化、過濾 文本分析流程 中英文的分詞 最大匹配算法 基于語言模型的分詞 Stemming和Lemmazation 停用詞的使用 拼寫糾錯(cuò)問題 編輯距離的實(shí)現(xiàn) 暴力搜索法 基于后驗(yàn)概率的糾錯(cuò) | 第6章:文本的表示 單詞的獨(dú)熱編碼表示 句子的獨(dú)熱編碼表示 tf-idf表示 句子相似度比較 獨(dú)熱編碼下的單詞語義相似度 從獨(dú)熱編碼到詞向量 詞向量的可視化、句子向量 |
第7章:【項(xiàng)目作業(yè)】豆瓣電影評(píng)分預(yù)測 數(shù)據(jù)描述以及任務(wù) 中文分詞 獨(dú)熱編碼、tf-idf 分布式表示與Word2Vec BERT向量 句子向量 | 第8章:詞向量技術(shù) 獨(dú)熱編碼表示的優(yōu)缺點(diǎn) 獨(dú)熱編碼與分布式表示的比較 靜態(tài)詞向量與動(dòng)態(tài)詞向量 學(xué)習(xí)詞向量 - 分布式假設(shè) SkipGram與CBOW SkipGram模型的目標(biāo) 負(fù)采樣(Negative Sampling) 基于矩陣分解的詞向量學(xué)習(xí) 基于Glove的詞向量學(xué)習(xí) 在非歐式空間中的詞向量學(xué)習(xí) |
第9章:【項(xiàng)目作業(yè)】智能客服問答系統(tǒng) 問答系統(tǒng)和應(yīng)用場景 問答系統(tǒng)搭建流程 文本的向量化表示 FastText 倒排表技術(shù) 問答系統(tǒng)中的召回、排序 | 第10章:語言模型 語言模型的必要性 馬爾科夫假設(shè) Unigram語言模型 Bigram、Trigram語言模型 語言模型的評(píng)估 語言模型的平滑技術(shù) |
?第三部分:自然語言處理與深度學(xué)習(xí)
第11章:深度學(xué)習(xí)基礎(chǔ) 理解神經(jīng)網(wǎng)絡(luò) 各類常見的激活函數(shù) 理解多層神經(jīng)網(wǎng)絡(luò) 反向傳播算法 神經(jīng)網(wǎng)絡(luò)中的過擬合 淺層模型與深層模型對比 深度學(xué)習(xí)中的層次表示 | 第12章:Pytorch的使用 環(huán)境安裝 Pytorch與Numpy的語法比較 Pytorch中的Autograd用法 Pytorch的Forward函數(shù) |
第13章:RNN與LSTM 從HMM到RNN模型 RNN中的梯度問題 解決梯度爆炸問題 梯度消失與LSTM LSTM到GRU 雙向LSTM模型 基于LSTM的生成 練習(xí):利用Pytorch實(shí)現(xiàn)RNN/LSTM | 第14章:Seq2Seq模型與注意力機(jī)制 Seq2Seq模型 Greedy Decoding Beam Search 長依賴所存在的問題 注意力機(jī)制 注意力機(jī)制的不同實(shí)現(xiàn) |
第15章:【項(xiàng)目實(shí)戰(zhàn)】京東智能營銷文案生成 構(gòu)建Seq2Seq模型 Beam Search的改造 模型調(diào)優(yōu) Length Normalization Coverage Normalization 評(píng)估標(biāo)準(zhǔn) Rouge Pointer-Generator Network PGN與Seq2Seq的融合 | 第16章:動(dòng)態(tài)詞向量與ELMo技術(shù) 基于上下文的詞向量技術(shù) 圖像識(shí)別中的層次表示 文本領(lǐng)域中的層次表示 深度BI-LSTM ELMo模型簡介及優(yōu)缺點(diǎn) ELMo的訓(xùn)練與測試 |
第17章:自注意力機(jī)制與Transformer 基于LSTM模型的缺點(diǎn) Transformer結(jié)構(gòu)概覽 理解自注意力機(jī)制 位置信息的編碼 理解Encoder與Decoder區(qū)別 理解Transformer的訓(xùn)練和預(yù)測 Transformer的缺點(diǎn) | 第18章:BERT與ALBERT 自編碼器介紹 Transformer Encoder Masked LM BERT模型及其不同訓(xùn)練方式 ALBERT |
第19章:【項(xiàng)目實(shí)戰(zhàn)】京東智能客服系統(tǒng)項(xiàng)目 對話系統(tǒng)的分類方法 檢索方式與生成方式 對話系統(tǒng)架構(gòu) 意圖識(shí)別分類器 閑聊引擎的搭建 Transformer與BERT的使用 | 第20章:GPT與XLNet Transformer Encoder回顧 GPT-1,GPT-2,GPT-3 ELMo的缺點(diǎn) 語言模型下同時(shí)考慮上下文 Permutation LM 雙流自注意力機(jī)制 Transformer-XL |
?第四部分、信息抽取
第21章:命名實(shí)體識(shí)別與實(shí)體消歧 信息抽取的應(yīng)用和關(guān)鍵技術(shù) 命名實(shí)體識(shí)別 NER識(shí)別常用技術(shù) 實(shí)體消歧技術(shù) 實(shí)體消歧常用技術(shù) 實(shí)體統(tǒng)一技術(shù) 指代消解 | 第22章:關(guān)系抽取 關(guān)系抽取的應(yīng)用 基于規(guī)則的方法 基于監(jiān)督學(xué)習(xí)方法 Bootstrap方法 Distant Supervision方法 |
第23章:依存文法分析 從語法分析到依存文法分析 依存文法分析的應(yīng)用 使用依存文法分析 基于圖算法的依存文法分析 基于Transtion-based的依存文法分析 其他依存文法分析方法論 | 第24章:知識(shí)圖譜 知識(shí)圖譜以及重要性 知識(shí)圖譜中的實(shí)體和關(guān)系 利用非結(jié)構(gòu)化數(shù)據(jù)構(gòu)造知識(shí)圖譜 知識(shí)圖譜的設(shè)計(jì) |
第25章:【項(xiàng)目實(shí)戰(zhàn)】京東同類商品競價(jià)搜索項(xiàng)目 Entity Linking介紹 Entity Linking技術(shù)概覽 從商品描述、商品標(biāo)題中抽取關(guān)鍵實(shí)體 搭建商品知識(shí)圖譜 基于GNN學(xué)習(xí)商品的詞嵌入 商品的ranking以及相似度計(jì)算 |
?第五部分:圖神經(jīng)網(wǎng)絡(luò)以及其他前沿主題
第26章:模型的壓縮 模型壓縮的必要性 常見的模型壓縮算法總覽 基于矩陣分解的壓縮技術(shù) 從BERT到ALBERT的壓縮 基于貝葉斯模型的壓縮技術(shù) 模型的量化 模型的蒸餾方法 | 第27章:圖神經(jīng)網(wǎng)絡(luò) 卷積神經(jīng)網(wǎng)絡(luò)的回顧 圖神經(jīng)網(wǎng)絡(luò)發(fā)展歷程 圖卷積神經(jīng)網(wǎng)絡(luò)(GCN) GAT詳解 |
《京東NLP企業(yè)項(xiàng)目實(shí)戰(zhàn)訓(xùn)練營》
專注于培養(yǎng)行業(yè)TOP10%的NLP工程師
對課程有意向的同學(xué)
二維碼咨詢
????????????
03?
教學(xué)體系
課程采用項(xiàng)目式教學(xué)(PBL)教學(xué)方式,同時(shí)參考了美國頂級(jí)院校的教學(xué)培養(yǎng)體系。日常的教學(xué)授課通過8大維度,保障每位學(xué)員學(xué)習(xí)效果。
?01?項(xiàng)目講解&實(shí)戰(zhàn)幫助
訓(xùn)練營最終的目的是幫助學(xué)員完成項(xiàng)目,理解項(xiàng)目中包含核心知識(shí)技能,訓(xùn)練營中會(huì)花大量的時(shí)間幫助學(xué)員理解項(xiàng)目以及所涉及到的實(shí)戰(zhàn)講解。
▲節(jié)選往期部分課程安排
?02最佳工業(yè)實(shí)戰(zhàn)
來自京東智聯(lián)云等業(yè)界專家來講述工業(yè)界的最佳工程實(shí)戰(zhàn),如AI模型的部署、代碼編寫、模型的調(diào)參以及debug等技術(shù)。
▲源自京東智聯(lián)云AI某模塊架構(gòu)圖
?03專業(yè)的論文解讀
作為AI工程師,閱讀論文能力是必須要的。在課程里,我們會(huì)安排經(jīng)典英文文章供學(xué)員閱讀,之后由老師幫助解讀。? ?
????
▲節(jié)選往期部分論文安排
?04代碼解讀&實(shí)戰(zhàn)
對于核心的模型如BERT,XLNet都會(huì)精心安排代碼解讀和實(shí)戰(zhàn)課,幫助學(xué)員深入理解其細(xì)節(jié)并有能力去實(shí)現(xiàn)。
▲BERT模型代碼實(shí)戰(zhàn)講解
?05行業(yè)案例分享
訓(xùn)練營過程中會(huì)邀請合作的專家來分享行業(yè)案例以及技術(shù)解決方案,如知識(shí)圖譜的搭建、保險(xiǎn)領(lǐng)域的客服系統(tǒng)等。
▲專家分享
《Google YouTube 基于深度學(xué)習(xí)的視頻推薦》
嘉賓簡介:曾博士
計(jì)算機(jī)視覺,機(jī)器學(xué)習(xí)領(lǐng)域?qū)<?/p>
先后在CVPR,ACMMM,TPAMI,SCI 期刊,EI 會(huì)議等發(fā)表超過30篇論文
?06日常社群答疑
為了幫助解決學(xué)員遇到的問題,專業(yè)助教會(huì)提供全天社群答疑服務(wù)。我們的助教均來來自于一線AI公司和國內(nèi)外名校,扎實(shí)的理論和工業(yè)界應(yīng)用也是我們選拔助教老師的重要標(biāo)準(zhǔn),拒絕空談理論。
▲社群內(nèi)老師專業(yè)的解答
?07日常作業(yè)&講解
為了鞏固對一些核心知識(shí)點(diǎn),學(xué)員除了大項(xiàng)目,也需要完成日常的小作業(yè)。之后助教會(huì)給出詳細(xì)的解答。
▲課程學(xué)習(xí)中的小作業(yè)
?08學(xué)員畢業(yè)去向
04?
課程適合哪些學(xué)員吶?
大學(xué)生:
計(jì)算機(jī)或者信息領(lǐng)域相關(guān)的本科/研究/博士生,畢業(yè)后希望從事AI相關(guān)的工作;
希望在真實(shí)工業(yè)場景中磨煉技術(shù),提升職場競爭力;
畢業(yè)之后希望申請國內(nèi)外名校的碩士或者博士。
在職人士:
具備良好的工程研發(fā)背景,希望從事AI相關(guān)的項(xiàng)目或者工作;
從事AI工作,希望進(jìn)一步提升NLP實(shí)戰(zhàn)經(jīng)驗(yàn);
從事NLP工作,希望深入了解模型機(jī)理;
AI developer, 希望突破技術(shù)瓶頸, 了解NLP前沿信息。?
入學(xué)標(biāo)準(zhǔn)
1.理工科專業(yè)相關(guān)本科生,碩士生或博士生或者IT領(lǐng)域的在職人士;
2.具備很強(qiáng)的動(dòng)手能力、熟練使用Python編程;
3.具備良好的英文文獻(xiàn)閱讀能力,至少達(dá)到CET-4級(jí)水平。
《京東NLP企業(yè)項(xiàng)目實(shí)戰(zhàn)訓(xùn)練營》
專注于培養(yǎng)行業(yè)TOP10%的NLP工程師
對課程有意向的同學(xué)
二維碼咨詢
????????????
總結(jié)
以上是生活随笔為你收集整理的做这个AI项目面试通过率达95%的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 历史转折中的伟人
- 下一篇: lia人是什么意思_69年属鸡人终身灾难