5月份Github上最热门的数据科学和机器学习项目
GitHub最近以數十億美元的交易被微軟收購。GitHub一直是開發人員之間協作的終極平臺,我們已經看到數據科學和機器學習社區同樣非常需要它,因此,我們希望GitHub能在微軟的保護下繼續發展下去。
在本月排行中,上榜的項目有英特爾開源的NLP架構庫,微軟推出ML.NET以支持Dot Net開發者的機器學習等。下面我們一起看下詳細榜單:
1、ML.NET
ML.NET是一個開放源代碼的機器學習框架,旨在讓 .NET 開發者更快上手機器學習。它使開發者們能夠使用.NET開發自己的模型,而且不需要構建機器學習模型的經驗。這是目前的預覽版,包含基本的分類和回歸算法。
ML.NET最初是由Microsoft創建的,并且已經被用于各種產品當中,如Windows,Excel,Access,Bing等。此版本還捆綁了用于各種模型訓練的.NET API。(項目地址:https://github.com/dotnet/machinelearning)
2、NLP Architect
NLP Architect是一個開源的Python庫,使數據科學家能夠探索自然語言處理(NLP)和自然語言理解(NLU)領域最先進的深度學習技術。它由英特爾實驗室的研究人員開發并且開源。幫助開發人員為聊天機器人和虛擬助手等會話應用提供所必需的功能,比如名稱實體識別,意圖提取和語義分析等。
這個庫中我最喜歡的組件之一是一個可視化組件,它以整潔的方式顯示模型的注釋。
上圖是NLP的框架。(項目地址:https://github.com/NervanaSystems/nlp-architect)
3、Amazon Scrape
這個python包使您能夠從亞馬遜搜索和抓取產品信息。使用該包可以代替編寫代碼行來確定需要分析哪些產品,。你只需輸入你想要搜索的關鍵字和最大產品數量(這是可選的)。數據最終將以CSV格式輸出,然后你可以將其插入到分析工具中進行分析。(項目地址:https://github.com/tducret/amazon-scraper-python)
4、PIGO
Pigo是Go編程語言開發的人臉檢測庫。它基于“Pixel Intensity Comparison -based Object detection” ?研究論文。這個庫的一些主要特點是:
● 處理速度快
● 在檢測之前不需要圖像預處理
● 不需要計算積分圖像,圖像金字塔,HOG金字塔或任何其他類似的數據結構
● 人臉檢測基于以二進制文件數據樹結構編碼的像素強度比較(項目地址:https://github.com/esimov/pigo)
5、RL-Adventure-2: Policy Gradients
這是所有的強化學習(RL)愛好者。深度學習推動了RL編程人工智能以及人類專家級技能Atari游戲。該存儲庫涵蓋了策略梯度算法的有趣的新擴展,這是解決RL問題最受歡迎的選擇之一。這些擴展導致了訓練時間的改進以及強化學習的整體表現。(詳情:https://github.com/higgsfield/RL-Adventure-2)
總結
以上是生活随笔為你收集整理的5月份Github上最热门的数据科学和机器学习项目的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 10G 职场晋升/IT干货/生活技能/理
- 下一篇: 史上首次!世界杯使用视频裁判