计算机工程与信息技术学报

对小数据含义和挖掘的不同方法

瑞安·H·林德利斯巴赫

大数据在数据挖掘中非常流行,但通常仅限于大企业。小数据通常被认为是大数据的一个子集。例如,Google 拥有数万亿条用于搜索的记录,但这本身并没有什么用处。当人们在 Google 上搜索某些内容时,通常第一页只会显示 10 到 15 个结果。为了实现这一点,Google 已经将大数据转化为小数据。真正的价值在于小数据子集。然而,小数据是大数据子集的想法并不是小数据的唯一定义。只产生小数据的小型企业也可以从数据挖掘实践中受益。只看小数据会出现什么问题?

免责声明: 此摘要通过人工智能工具翻译,尚未经过审核或验证