Arun B Prasad、Vikas RaoVadi、A Prakash、Pavithra M、A Velayudham 和 Md Sajid Anwer
整合互联网上可访问的学术论文的可用信息是学术研究的一项关键任务。重点信息收集是引文任务的必要内容,通过各种二手数据来源进行内容开发必不可少。在这项工作中,我们使用一种理解方法来获取数据,重点是学生期刊数据挖掘算法。我们利用一种称为 INFO-MAP 的认知信息检索方案来机械地获取数据源。研究结果表明,我们可以利用 INFO-MAP 从几种引文格式中正确获取作者、姓名、出版物、卷、期、日期和页码信息。基因组学数据库的参考检索平均总面积可靠性为 6 个引文类别的 97.87%。