工业安全大数据汇聚与治理、2、多模态数据挖掘与知识图谱构建、3、超融合软件平台构建与工程应用概念
1、工業安全大數據匯聚與治理
大數據匯聚,即將多元化數據整合,由于時空大數據來源廣泛、渠道繁雜、形式各異,匯聚時要采用一定方法如:多源異構數據自適應匯聚。數據匯聚系統是多源異構生態系統科學數據的匯聚平臺,通過科學數據、知識資源的匯聚匯交,構建生態系統領域統一的科學數據存儲庫,支撐數據產品加工挖掘分析,支撐資源共享服務。
大數據治理:對數據本身質量的管理,對數據的全生命周期進行管理,包含傳統數據處理(聚類分析、因子分析、相關分析、對應分析、回歸分析)、數據質量提升等展現數據價值的工作。數據質量提升:事前預防(制定質量檢測模型)、事中監控(監控原始數據和數據中心質量)、事后改善(建立相關流程工具修復數據質量)。目的:實現數據價值最大化和生產風險最低化。核心:規劃監控和執行。
2、多模態數據挖掘與知識圖譜構建
多模態:不單單是文字數據還有圖像等數據,如圖像中含有一些單單用文字難以識別的屬性或關系(鍵盤、屏幕、筆記本之間的關系;香蕉的黃色或或黃綠色而非藍色)。
多模態數據挖掘:研究怎么將圖片和文字對應起來的問題,不能簡單的拼接,對于需要識別出多個實體的情況不合適。
多模態知識圖譜的構建通常有兩種方法:①用文本知識圖譜中的文字標記圖像;②將圖像定位到文本知識圖譜中的實體。
3、超融合軟件平臺構建與工程應用
超融合架構:指在同一套單元設備中不僅僅具備計算、網絡、存儲和服務器虛擬化等資源和技術,而且還包括備份軟件、快照技術、重復數據刪除、在線數據壓縮等元素,而多套單元設備可以通過網絡聚合起來,實現模塊化的無縫橫向擴展,形成統一的資源池。超融合架構是實現“軟件定義數據中心”的終極技術途徑。HCI類似Google、
多模態知識圖譜構建和數據挖掘方向,多模態關系抽取,思考視頻和語音融合,(動作序列分類網絡)搜資料當下研究方向進展遇到的困難,人工客服只有語音能否是開視頻的形式進行指導,視頻直接上傳至服務器處理?
場景:在家咖啡從桌子上掉落在地上,主人說:“我靠”,機器人根據這兩個字無法判斷接下來的行為,顯然是不智能的。如果加上圖像,機器人能識別到咖啡掉在地上這個“動作”,根據主人“我靠”驚訝的文字,就可以執行讓掃地機器人去清理咖啡污漬,甚至能接一杯新的咖啡。如果咖啡倒落在地上而主人翁沒有說:“我靠”,那機器人只去打掃也不失“聰慧”。
VQA:Visual Question Answering
Image caption:根據一張圖像生成一句話
數據集:可以從社交平臺爬取,一般社交平臺會有圖片對應的文字信息,使用視覺對象的標簽和視覺特征與文本表示進行拼接。直接將圖像和文本進行拼接沒有進行細粒度的挖掘,因為單模態中文本存在結構信息而圖像也存在視覺結構信息,所以利用每個模態的結構信息輔助完成多模態關系抽取。(圖片和文本都存在實體和關系)如下圖
總結
以上是生活随笔為你收集整理的工业安全大数据汇聚与治理、2、多模态数据挖掘与知识图谱构建、3、超融合软件平台构建与工程应用概念的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 钱包原理——助记词与公私钥
- 下一篇: python循环输入姓名并打印_pyth