埃鲁萨德·摩西,奥索拉莱·费斯图斯
在新兴且竞争激烈的电信市场中,移动电信运营商必须定期分析其存储的大量通话记录,以维护和管理其众多用户。考虑到其庞大规模所带来的挑战,这种顺序流数据分析需要一种有效的数据挖掘算法和技术。许多数据挖掘应用程序已被改编用于类似目的。然而,人们并没有过多地强调对呼叫详细记录 (CDR) 进行深入挖掘,因为呼叫详细记录是一种多维顺序流数据,其存储开销也随之而来。本文提出了一种用于多维通话记录分析的新算法。模式立方体算法 (PCA) 是用计算机程序实现的,并通过经验证明:大量 CDR 可以有意义地总结为一个方便的记录作为数据集市,其规模可减少约 90%,并且无论目标数据的大小如何,都可以从任何服务器处理大量数据。通过对 MTN Communications Nigeria Limited 改编的 CDR 样本进行广泛的实验研究,定量探索了 IT 资源的各种收益。