大数据相关总结(待续)
生活随笔
收集整理的這篇文章主要介紹了
大数据相关总结(待续)
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
“區(qū)塊鏈”、文本分析、hadoop、lucence
文本分析是說詞性分形, 分詞應(yīng)該是搜索引擎中的分詞器 ?比如現(xiàn)在最常用的是ik ?原來的是庖丁
需要做分詞索引: eg:你干嘛呢 ? 你 , 干嘛,呢
分析詞性和詞義還有詞頻,分詞一般就是中文麻煩點,英文簡單
lxh: 通過海量數(shù)據(jù)計算分析 ?可以提取出有用的數(shù)據(jù)關(guān)系模型 ?這些數(shù)據(jù)關(guān)系模型可以做推薦 ?可以計算用戶行為 ?可以做人物或者城市畫像等等 eg1: 拿到北京200w浮動車數(shù)據(jù)點 ?計算到北京的所有的道路網(wǎng)絡(luò)上 ?計算出每條道路的擁堵程度 ?車速 ?通行時間 eg2: 在電信做的工作就是拿到電信收集到的全國2e人的信令數(shù)據(jù) 計算分析 ?算出每個人工作在那里 ?每天幾天上下班 ?加班多不多 ?下周二可能出現(xiàn)在那里 平時喜歡做什么 ?再比如每天地鐵站幾點開始擁堵 ?需要限流排隊 ?某個景點在每年的什么時候出現(xiàn)高峰 ?高峰值大概什么樣 ?預(yù)測規(guī)劃這樣的。
文本分析是說詞性分形, 分詞應(yīng)該是搜索引擎中的分詞器 ?比如現(xiàn)在最常用的是ik ?原來的是庖丁
需要做分詞索引: eg:你干嘛呢 ? 你 , 干嘛,呢
分析詞性和詞義還有詞頻,分詞一般就是中文麻煩點,英文簡單
lxh: 通過海量數(shù)據(jù)計算分析 ?可以提取出有用的數(shù)據(jù)關(guān)系模型 ?這些數(shù)據(jù)關(guān)系模型可以做推薦 ?可以計算用戶行為 ?可以做人物或者城市畫像等等 eg1: 拿到北京200w浮動車數(shù)據(jù)點 ?計算到北京的所有的道路網(wǎng)絡(luò)上 ?計算出每條道路的擁堵程度 ?車速 ?通行時間 eg2: 在電信做的工作就是拿到電信收集到的全國2e人的信令數(shù)據(jù) 計算分析 ?算出每個人工作在那里 ?每天幾天上下班 ?加班多不多 ?下周二可能出現(xiàn)在那里 平時喜歡做什么 ?再比如每天地鐵站幾點開始擁堵 ?需要限流排隊 ?某個景點在每年的什么時候出現(xiàn)高峰 ?高峰值大概什么樣 ?預(yù)測規(guī)劃這樣的。
總結(jié)
以上是生活随笔為你收集整理的大数据相关总结(待续)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 米哈游人工桌面YOYO鹿鸣
- 下一篇: 解决通用串行总线控制器里全是叹号问题