海莉·特克莱塞拉塞
从大型交易数据库中挖掘高效用项集 (HUIM) 引起了广泛关注,因为它可以解释交易中购买的物品的收入。虽然大多数基于树的 HUI 挖掘算法将数据库转换为项目前缀树,但它们会丢弃没有希望的项目并消耗大量内存。事实证明,使用存储交易级信息的树与此类前缀树结合使用可以增强挖掘过程。在这方面,本研究提出了内存高效的树,即效用素数树 (UPT)、素数康托函数树 (PCFT) 和基于字符串的效用素数树 (SUPT),它们将整个交易信息编码在一个节点中,而不像基于前缀的树通过单个数据库扫描。在真实数据集和合成数据集上进行的实验表明,与文献中的树结构相比,这些结构消耗的内存要少得多。