一、自然语言处理概述
生活随笔
收集整理的這篇文章主要介紹了
一、自然语言处理概述
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1.自然語言處理概述
1.1 文本大數據的機遇和挑戰
- 語言是思維的載體,是人類交流思想、表達情感最自然、最直接、最方便的工具.
- 人類歷史上以語言文字形式記載和流傳的知識占知識總量的80%以上.
- 中國互聯網上有87.8%的網頁內容是文本表示的.
1.2 全世界網頁數量正以指數速率增長
- 中文網頁檢索的最高準確率不足40%。
1.3 跨語言通訊和信息獲取技術具有重要的用途
- 隨著社會全球化時代的到來,機器翻譯市場潛力巨大;
- 涉及的領域包括文化、商貿、旅游、體育等
1.4 總結
自然語言處理要解決的問題:
- 如何如何讓計算機能夠自動或半自動地理解自然語言文本,懂得人的意圖和心聲?
- 如何讓計算機實現海量語言文本的自動處理、挖掘和有效利用,滿足不同用戶的各種需求,實現個性化信息服務?
2 自然語言處理簡介
2.1 計算語言學(Computational Lingusitics)
- 通過建立形式化的計算模型來分析、理解和生成自然語言的學科,是人工智能和語言學的分支學科。
- 計算語言學是典型的交叉學科,其研究常常涉及計算機科學、語言學、數學等多個學科的知識。
2.2 自然語言理解(Natural Language Understanding, NLU)
- 自然語言理解是探索人類自身語言能力和語言思維活動的本質,研究模仿人類語言認知過程的自然語言處理方法和實現技術的一門學科。
2.3 關于理解的標準
- 如何判斷計算機系統的智能?
- 計算機系統的表現(act)如何?
2.4 自然語言處理
- 自然語言處理是研究如何利用計算機技術對語言問題(句子、篇章和話語)進行處理和加工的一門學科,研究內容包括對詞法、句法、語義和語用的識別、分類、提取、轉換和生成等各種處理方法和實現技術。
2.5 自然語言處理關鍵技術
- 基礎技術、核心技術和應用
2.6 中文信息處理
- 漢語:漢族的語言,是我國的主要語言。
- 中文:中國的語言文字,特指漢族的語言文字。
2.7 人類語言技術
- 自然語言處理技術迅速成為發展成為一門相對獨立的學科,而且該技術不斷與語音技術相互滲透和結合形成新的研究分支。
- “計算語言學”、“自然語言理解”或“自然語言處理”,往往默認為同一個概念;
總結
以上是生活随笔為你收集整理的一、自然语言处理概述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 四十四、ETL工具的查询_连接和映射
- 下一篇: 三、自然语言处理研究内容