核能科学与发电技术学报

使用基于知识的数据提取方法进行文本提取

Arun B Prasad、Vikas RaoVadi、A Prakash、Pavithra M、A Velayudham 和 Md Sajid Anwer

整合互联网上可访问的学术论文的可用信息是学术研究的一项关键任务。重点信息收集是引文任务的必要内容,通过各种二手数据来源进行内容开发必不可少。在这项工作中,我们使用一种理解方法来获取数据,重点是学生期刊数据挖掘算法。我们利用一种称为 INFO-MAP 的认知信息检索方案来机械地获取数据源。研究结果表明,我们可以利用 INFO-MAP 从几种引文格式中正确获取作者、姓名、出版物、卷、期、日期和页码信息。基因组学数据库的参考检索平均总面积可靠性为 6 个引文类别的 97.87%。

免责声明: 此摘要通过人工智能工具翻译,尚未经过审核或验证