當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

sklearn字典特征提取

發布時間：2024/9/30 编程问答 26 豆豆

生活随笔收集整理的這篇文章主要介紹了 sklearn字典特征提取小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

作用：對字典數據進行特征值化

sklearn.feature_extraction.DictVectorizer(sparse=True,…)
- DictVectorizer.fit_transform(X) X:字典或者包含字典的迭代器返回值：返回sparse矩陣
- DictVectorizer.inverse_transform(X) X:array數組或者sparse矩陣返回值:轉換之前數據格式
- DictVectorizer.get_feature_names() 返回類別名稱

我們對以下數據進行特征提取

[{'city': '北京','temperature':100}, {'city': '上海','temperature':60}, {'city': '深圳','temperature':30}] def dict_demo():"""字典特征值提取:return:"""data = [{'city': '北京', 'temperature': 100}, {'city': '上海', 'temperature': 60}, {'city': '深圳', 'temperature': 30}]# 1. 實例化一個轉換器默認返回 sparse矩陣將非0值按位置表示出來以節省內存提高加載效率transfer = DictVectorizer(sparse=False)# 應用場景：數據集中類別特征值較多；將數據集的特征-》字典類型；DictVectorizer轉換；本身拿到的就是字典# 2. 調用fit_transform()data_new = transfer.fit_transform(data)print("data_new:\n", data_new)print("特征名字:\n", transfer.get_feature_names())return None

對于特征當中存在類別信息的我們都會做one-hot編碼處理

總結

以上是生活随笔為你收集整理的sklearn字典特征提取的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。