Musa Karim*、Shumaila Furnaz、Tahir Saghir、Nadeem Hasan Rizvi 和 Ahmed Raheem
背景:心血管疾病 (CVD) 是全球死亡的主要原因。本研究旨在使用 Apriori 数据挖掘算法确定 2017 年 1 月至 2017 年 6 月期间在巴基斯坦一家三级医院门诊就诊的患者中心血管疾病风险因素的共现情况。
方法:本项横断面研究包括 2017 年 1 月至 2017 年 6 月期间在巴基斯坦卡拉奇国家心血管疾病研究所门诊就诊的 5,164 名连续患者。收集了所有入选患者的心血管疾病风险因素。应用数据挖掘技术 Apriori 算法开发和评估关联规则。应用了修剪方法,例如删除冗余规则、至少两个项目的最小长度、0.20 的最小支持度和 0.90 的最小置信度。
结果:在 5,164 名患者中,51.1% 为女性,42.7% 的患者年龄超过 50 岁。观察到的主要风险因素分别是高血压、肥胖、血脂异常和糖尿病。高血压是所有提取的关联规则的结果,其前因分别是超重/肥胖、血脂异常、女性超重/肥胖、50 岁以上、超重/肥胖伴有血脂异常、50 岁以上伴有血脂异常、女性年龄超过 50 岁和女性伴有血脂异常。
结论:基于Apriori算法,提取了心血管疾病(CVD)危险因素之间有意义的关联规则和模式,为降低心血管疾病(CVD)风险提供了可行的方法。