日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据分析与挖掘实战-中医证型关联规则挖掘

發布時間:2024/4/11 编程问答 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据分析与挖掘实战-中医证型关联规则挖掘 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

中醫證型關聯規則挖掘

  • 背景
    • 顯然,如今的中醫治療再度火了起來,歸根到底的原因還是中醫在某些疾病處理上具有天然優勢。
    • 而且,中醫治療沒有西醫治療的很多毒副作用。
    • “先證而治”。
  • 挖掘目標
    • 發現中醫癥狀間的關聯聯系和諸多癥狀之間的規律性,并且依據規則分析病因、預測病情發展以及為未來臨床診治提供有效借鑒。
    • 也就是說,借助乳腺癌患者病理信息,挖掘患者的癥狀與中醫證型之間的關聯聯系,對截斷治療提供依據,挖掘潛性證素。
  • 分析
    • 由于患者在特定的病程階段會有特定的臨床癥狀,所以可以運用中醫截斷療法進行治療,在辨病的基礎上圍繞各個病程的特殊癥候先證而治。截斷扭轉的主要觀點是強調早期治療,力圖快速控制病情,截斷病情的邪變深入,扭轉阻止疾病惡化。
    • 由于數據紙質化,只能使用問卷調查獲取數據,采用關聯規則算法,挖掘各中醫證素與乳腺癌TNM分期之間的聯系。(乳腺癌基本分期原則,I比較輕,IV比較嚴重。
  • 處理過程
    • 數據獲取
      • 問卷收集并整理數據。
    • 數據探索
      • 由于問卷由我指定,基本結構和問題點已知,這里無需數據探索,可以直接處理。
    • 數據預處理
      • 對原始數據進行數據預處理,包括數據清洗(存在無效問卷)、屬性規約(去除無關屬性)、數據變換。
        • 這里數據變換包含了屬性構造和數據離散化。
        • 為了更好的反映證素分布特征,采用證型系數代替單證型的證素得分:證型系數 = 該證型得分/該證型總分。
        • 由于Apriori關聯規則算法不能處理連續型數值變量,原始數據需要離散化。(使用聚類方法)
    • 數據挖掘建模
      • 利用建模數據,采用關聯規則算法,調整模型輸入參數,獲取各中醫證素與乳腺癌TNM分期之間的關系。
      • 本案例的目標是探索乳腺癌患者TNM分期與中醫證型系數之間的關系,使用關聯規則算法,挖掘它們之間的聯系。
      • 關聯規則算法主要用于尋找數據集中項之間的關聯聯系,它揭示數據項之間的位置關系,基于樣本的統計規律,進行關聯規則的挖掘,根據所挖掘的關聯關系,可以從一個屬性的信息來推斷另一個屬性信息,當置信度達到某一閾值時,可以認為規則成立。
      • 使用Apriori需要設置建模參數的最小支持度和最小置信度,調整到合適為止,如何設置沒有統一標準,一般認為根據經驗設置。遺憾的是主流的庫中均沒有Apriori等關聯規則函數,自行編寫。
      • 根據結果如A3---F4---H4,理解為A3,F4=H4,很多得到的規則,我們只需要以H開頭的為規則結果的項。
    • 后續處理
      • 結合實際業務,對模型結果進行分析,將模型結果應用到實際業務中,輸出關聯規則結果。
  • 補充說明
    • 首先,盡管關聯規則算法是機器學習、深度學習、數據挖掘中常用的模型,然而很遺憾的是主流的sklearn、keras等機器學習深度學習主流庫沒有進行封裝。本案例使用自行編寫的Apriori算法。
    • 參考書《Python數據分析與挖掘》
# -*- coding: utf-8 -*- """ 利用Apriori算法進行關聯規則分析 """ import pandas as pd from apriori import *if __name__ == '__main__':# 根據離散化處理的文件inputFile = './data/apriori.txt'data = pd.read_csv(inputFile, header=None, dtype=object)print('\n轉換原始數據至0-1矩陣...')# 轉換0-1矩陣的過渡函數ct = lambda x: pd.Series(1, index=x[pd.notnull(x)])b = map(ct, data.values)# 實現矩陣轉換,空值用0填充data = pd.DataFrame(list(b)).fillna(0)# 刪除中間變量b,節省內存del b# 最小支持度support = 0.06# 最小置信度confidence = 0.75ms = '---'print('\n開始搜索關聯規則...')find_rule(data, support, confidence, ms)

這里只列舉了建模的代碼,數據集和更多代碼可以訪問我的github,歡迎star或者fork。

總結

以上是生活随笔為你收集整理的数据分析与挖掘实战-中医证型关联规则挖掘的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。