清华大学人工智能研究院成立自然语言处理与社会人文计算研究中心
2019年7月1日,清華大學人工智能研究院自然語言處理與社會人文計算研究中心(以下簡稱中心)成立儀式在清華大學FIT樓舉行。清華大學副校長、清華大學人工智能研究院管委會主任尤政院士,清華大學人工智能研究院院長張鈸院士出席成立儀式并共同為中心揭牌。清華大學人工智能研究院院長助理朱軍教授主持成立儀式。
尤政院士致辭
尤政院士在致辭中指出,人類語言是人類智能的本質體現,更是人工智能技術當下和未來發展的戰略制高點。清華大學是國內最早開展自然語言處理的單位之一,經過四十年的不懈努力,已經發展成國內外自然語言處理研究的一方重鎮。中心的成立對于推動清華大學人工智能的深入發展具有十分重要的意義。自然語言處理與社會科學及人文科學相結合,具有大跨度學科交叉的性質,既是人工智能研究本身的積極拓展,也是對傳統學科在人工智能時代的守正出新。希望中心能夠凝聚清華自然語言處理研究力量,加強與人文社科學科的交叉合作,開展具有世界水平的自然語言處理基礎理論研究和關鍵技術創新,服務于清華與國家的人工智能發展戰略。
張鈸院士致辭
張鈸院士代表清華大學人工智能研究院致辭。他指出語言是人類智能的重要標志,機器自然語言理解是人工智能的終極目標。清華大學在自然語言處理方面有著深厚的研究積淀,1978年成立人工智能與智能控制教研組時,自然語言處理就是其中的重要研究方向之一,在黃昌寧教授領導下迅速發展成為國內領軍的研究單位。新成立的中心將致力于實現自然語言處理與人文社科的深度融合,從語言、社會學、人文學等多個角度理解人類智能的本質,是研究院人工智能基礎研究的重要組成部分。希望中心再接再厲,在自然語言處理與社會學、人文學的交叉研究上形成特色,引領我國自然語言處理和社會人文計算研究領域的發展。
清華大學自然語言處理研究方向開拓者黃昌寧教授(左)在成立儀式上
朱軍教授主持儀式
尤政院士與張鈸院士為中心揭牌
中心主任由清華大學人工智能研究院常務副院長孫茂松教授擔任。在成立儀式上,尤政院士和張鈸院士向孫茂松教授頒發了中心主任聘書。中國中文信息學會原理事長、中國工程院院士倪光南,滑鐵盧大學講座教授、加拿大皇家科學院院士李明,微軟亞洲研究院副院長、國際計算語言學會會長周明,英國帝國理工學院數據科學研究所所長、英國皇家工程院院士郭毅可被聘為中心學術顧問。尤政院士和張鈸院士現場向出席會議的李明院士和周明副院長頒發了中心學術顧問聘書。
孫茂松教授被聘為中心主任
李明院士、周明博士被聘為中心學術顧問
在成立儀式上,李明院士、周明副院長以及清華大學法學院院長申衛星教授、清華大學人文學院副院長劉石教授先后發言,對中心的成立表示衷心祝賀。
申衛星教授發言
劉石教授發言
中心成立儀式合影
嘉賓合影
成立儀式之后舉行了自然語言處理前沿學術報告與開源成果發布會,分別由中心常務副主任劉洋副教授和中心主任孫茂松教授主持。
李明院士做特邀報告
李明院士做了題為《第二代對話機器人》的特邀報告。報告指出缺乏理解能力、缺乏學習能力、被動地“人云亦云”是第一代聊天機器人的主要缺陷,其原因在于目前的深度學習技術還不具備理解和使用人類語言所必需的概念抽象和邏輯推理能力。他認為實現理解和學習是第二代聊天機器人的主要目標,機器人只有通過自動學習和社會參與才能獲得不斷地成長,從而具備更強的運用人類語言的能力。
周明博士做特邀報告
周明博士做了題為《關于神經網絡自然語言處理的思考》的特邀報告。報告對基于神經網絡的自然語言處理的研究進展進行了系統地回顧與總結,指出自然語言處理目前面臨著深度學習計算成本高昂、大規模標注數據稀缺、難以實現真正的理解與推理等關鍵挑戰。他認為未來應當從計算能力、數據資源、模型算法、系統應用、人才培養、交叉合作等六個方面進一步推動自然語言處理的發展。
中心成員劉洋、矣曉沅和劉知遠分別介紹了在數據驅動的機器翻譯、基于深度學習的中文詩歌自動生成系統以及大規模自然語言預訓練模型等方面的最新研究成果,并發布了相關開源工具、數據與模型。?
劉洋副教授介紹開源成果THUMT
THUMT是一個基于深度學習的機器翻譯系統。該系統使用了數據驅動的機器翻譯技術,具備良好的語言無關性,在具備訓練數據的條件下可以迅速為新語種部署系統。本次開源成果公布了在TensorFlow平臺上開發的新版本,采用了主流Transformer模型,集成了目前最新的神經機器翻譯技術,具有訓練速度快(支持多機多卡并行)、顯存占用低(支持單精度浮點數計算)、翻譯性能高(與國際機器翻譯開源軟件相比位居前列)、易于可視化分析(支持層級相關反饋算法)等優點。此外還開放了70萬句對的句級對齊漢英平行語料庫和4萬句對的詞級對齊漢英平行語料庫。
項目網址:thumt.thunlp.org?
在線翻譯系統網址:translate.thumt.cn
THUMT系統網址
THUMT翻譯界面
開源項目網址
矣曉沅博士生介紹開源成果THUAIPoet?
THUAIPoet (九歌)?是一個基于深度學習的中文詩歌自動生成系統,支持集句詩、絕句、藏頭詩、詞等不同體裁詩歌的在線生成。此次成果發布開源了系統中的無監督風格詩歌生成模型StylisticPoetry源碼(相關論文發表于EMNLP 2018),能夠在無標注數據集上進行任意數量的風格解耦控制。此外還發布兩個人工標注的詩歌數據集(詩歌質量數據集和詩歌情緒數據集),以及國內外詩歌生成相關的主要論文列表。
GitHub網址:github.com/thunlp-aipoet
九歌APP網址:jiuge.thunlp.cn
九歌APP網址
九歌詩詞創作系統界面
GitHub開源網址
劉知遠副教授介紹開源成果OpenCLaP
OpenCLaP(Open Chinese Language Pre-trained Model Zoo)是一個多領域中文預訓練模型倉庫。通過在多領域大規模中文文本的預訓練,這些預訓練模型可以在下游任務上進行微調以提高任務性能。本次開源成果公布了基于法律文本和百度百科千萬級文檔的預訓練模型,支持最大512長度的文本輸入適配多種任務需求。未來還將持續加入更多更強的預訓練模型,如增加更多訓練語料,引入大規模知識,使用全詞覆蓋策略等。
GitHub網址:github.com/thunlp/OpenCLaP
項目網址:zoo.thunlp.org?
OpenCLaP網址
GitHub開源網址
中心是清華大學人工智能研究院設立一周年之際成立的第八個研究中心。中心將緊密圍繞人類語言所體現的人類智能本質,重點研究魯棒、可解釋的自然語言處理方法與技術,深入探索語言理解與生成技術在社會人文計算領域的應用,努力建設以中文為核心、覆蓋多種語言、從詞法到篇章的全流程自然語言處理技術框架與計算平臺,力爭產出以智能創作、智能語言學習、智能教育、智能司法為代表的有國際影響力和重大民生意義的社會人文計算研究成果。?
本中心的前身是清華大學計算機系自然語言處理課題組,早在上個世紀七十年代末就在黃昌寧教授的帶領下從事自然語言處理研究工作,是國內開展相關研究最早、深具影響力的科研單位,同時也是中國中文信息學會(全國一級學會)計算語言學專業委員會的掛靠單位,孫茂松教授現任該專業委員會的主任。
?
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結
以上是生活随笔為你收集整理的清华大学人工智能研究院成立自然语言处理与社会人文计算研究中心的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 第三届“达观杯”文本智能算法大赛参赛指南
- 下一篇: 漫画解读ERNIE:能和BERT一较高下