sklearn字典特征提取
生活随笔
收集整理的這篇文章主要介紹了
sklearn字典特征提取
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
作用:對字典數據進行特征值化
- sklearn.feature_extraction.DictVectorizer(sparse=True,…)
- DictVectorizer.fit_transform(X) X:字典或者包含字典的迭代器返回值:返回sparse矩陣
- DictVectorizer.inverse_transform(X) X:array數組或者sparse矩陣 返回值:轉換之前數據格式
- DictVectorizer.get_feature_names() 返回類別名稱
我們對以下數據進行特征提取
[{'city': '北京','temperature':100}, {'city': '上海','temperature':60}, {'city': '深圳','temperature':30}] def dict_demo():"""字典特征值提取:return:"""data = [{'city': '北京', 'temperature': 100}, {'city': '上海', 'temperature': 60}, {'city': '深圳', 'temperature': 30}]# 1. 實例化一個轉換器 默認返回 sparse矩陣 將非0值按位置表示出來 以節省內存 提高加載效率transfer = DictVectorizer(sparse=False)# 應用場景:數據集中類別特征值較多;將數據集的特征-》字典類型;DictVectorizer轉換;本身拿到的就是字典# 2. 調用fit_transform()data_new = transfer.fit_transform(data)print("data_new:\n", data_new)print("特征名字:\n", transfer.get_feature_names())return None
對于特征當中存在類別信息的我們都會做one-hot編碼處理
總結
以上是生活随笔為你收集整理的sklearn字典特征提取的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Nuxt如何发起跨域资源请求?
- 下一篇: 【机器学习】特征提取代码汇总