阿拉瓦·雷富菲
使用 XML 标记文档进行代词首语解析
首语重复解析已成为自然语言处理系统中的一个主要问题;在本文中,我们提出了一种解析方法,即通过确定子句语法解析文本,然后将其转换为 XML 标记表示,其中句子元素用话语、句法和语义属性进行标记。进行此扩展主要是为了测试使用 XML 标记文档进行首语重复解析的可行性。XML 表示允许以优雅而简单的方式用首语信息丰富有价值的文本。该系统的性能主要源于在模块化架构中集成多个知识源,并使用约束和偏好来选择先行词。开发的系统建议解析代词首语重复,即法语文本的人称代词。