第1页:W3C标准:在RDF与Topic Maps间建立联系 第2页:W3C标准:在RDF与Topic Maps间建立联系
Garshol 提案
该提案最初是RDF与主题地图模型比较分析的一部分。该分析得到进一步发展(并扩充到部分解决OWL问题)。此方法已由作者在Ontopia知识套件(Ontopia Knowledge Suite )中执行。
作者通过检验两个范例的基本概念来比较RDF与主题地图,这些概念包括:“符号与事物”、“声明”、“同一性”、“具体化”、“资格”与“类型和子类型”。Garshol说明如何在每个范例中表达这些概念,并指出其相似与不同之处。
Garshol称,RDF与主题地图二者都是“以同一性为基础的技术”;也就是说,二者的关键概念是表现可确定性事物 的符号 ,这些事物决定做出哪项声明 。在主题地图中,“事物”被称作“主体”;在RDF中则被称作“资源”,尽管定义不同,它们本质上是同一个概念。主体由主题来表现;资源由RDF节点(或简称为节点)来表现。据Garshol称,“主题”与“节点”间的对应关系紧密,但并不确切。
声明 表达事物之间的关系,在主题地图中表现为“主题特性”,而在RDF中表现为“语句”。主题特性可为一个名称、事件或关联。因此,在理论上RDF语句可映射到这三种概念中的任何一个概念中。要特别注意关联,因为可能会发生一些变化,但所有的RDF语句都是二元的。二元关联与RDF语句之间可建立相当完美的映射,但非二元关联则无法做到。
另一方面,我们认为主题地图与RDF中的类型与子类型 概念是同等的(subClassOf 属性是RDF Schema,而非RDF本身的一部分这一事实除外)。
作者认为前一个提案描述的对象映射方法十分重要,且难以应用。作为替代,Garshol提案应用由普通映射加强的针对词汇表的映射。一般来说,语句应被映射到名称、事件或关联中,因为这样可提供最“自然”的结果。但是,如果不了解所讨论的事物的语义,就不可能知道哪一项最适于任何给定的语句——因此需要针对词汇表的映射。
以下面的RDF语句为例:
<http://example.com/X>
?<http://example.com/Y>
?"foo"
这个语句能被映射到主题地图中的一个名称或内部事件中(因为对象是一个文字)。同样,下面这个语句:
<http://example.com/X>
?<http://example.com/W>
??lt;http://example.com/Z>
能够被映射到一个关联或是一个外部事件中(因为对象是一个资源)。如果对特性Y和W的语义不了解,就不可能执行最理想的语义转换。
对RDF2TM映射而言,解决方法在于提供额外的映射信息。这通过RDF词汇表RTM来完成,它被用来解释RDF文件(或它们的图解),并因此指导转换过程。RTM词汇表用来将RDF转换为主题地图,它包含下列RDF特性:maps-to, type, in-scope, subject-role, object-role 。
对TM2RDF而言,需要额外的信息来获得最理想和/或可预期的结果。至于RDF2TM转换,执行过程提供某种程度的默认信息。主体标识符与主体定址器都自动映射到资源URI中。另外,缺乏任务映射信息时,关联可输出到RDF中。在这种情况下,作为结果的语句的主体与对象是随意选择的。
如当前所说明的,Garshol提案提供一个几乎完美的解决方案,且作者本人确定了大多数不完善的方面。那些没有提及的内容包含:容器、收集、XML文字和类型文字。只要在转换过程中生成了适当的反映射,就可达到高度的可逆性与反复性。主体定址器还存在一个问题,当由主题地图循环到RDF,再返回到主题地图时,它以主体标识符结束。
Unibo 提案
与前面描述的那些方法相比,Unibo提案的作者们明显更喜欢Garshol的方法,因为后者生成更多“可读”的结果,并与他们自己的方法相似。它们之间的主要不同在于Garshol并不利用“标准RDF与RDFS谓语”,因此总要需要指定一个映射。
像早期的作者一样,Ciancarini et al认为解决转换问题有两个基本的方法,与本调查所称的对象映射与语义映射相对应。第一个似乎有问题,因为“被转换的文件必须与直接用目标语言书写的文件完全不同,并几乎不可读。”第二个的问题在于它“不能总是”确定语义等同项,并且那样做通常需要采用个案分析方法,因此没有通用性。
所以作者们考虑应用一个混合方法作为最理想的解决方案,他们在Meta Converter中的执行过程结合了一个普通映射,它努力与原始的语义尽可能保持紧密联系,并能够用一个XML词汇表定义特殊映射。
Unibo提案相当完善,但一些功能,如RDF中的语言标签和数据键入,任务与主题地图的具体化,都没有明确包括在内。这个提案允许某种程度的可逆性,但是循环的结果可能不会总与起点相同。例如,应用普通映射,大多数的RDF语句将转换成带非类型任务的类型关联,每个关联在转换回RDF时将生成几个语句。
只要提供映射信息,此方法就可在两个方向产生稍微自然的结果。普通的转换远不如人意,一个单独的二元关联会得到九个RDF语句。
解决余下的问题
在评估这些提案的几个可能标准中,我们选出两个标准——完整性与自然性——作为评估每个提案的质量与限制的最为中肯而适当的标准。
完整性 ——定义源模型中的任何语义结构恰当地(即不丢失也不增加信息)转换到目标模型中的完整程度,清楚地说明了每个转换方法的语义能力。
自然性 ——定义结构与内容中被转换的模型模拟在目标范例中直接表达的等同模型的程度,说明为转换结果提供的每个方法与同一范例中的其它模型进行合并、交互的完整水平。
对提案的分析确定了两个转换的主要方法,我们称之为“对象映射”(为源范例的每个结构组件提供转换)和“语义映射”(为源模型的每一个概念结构提供一个对应的结构)。
因此,分析作品中提供的选项与解决方案,清楚地说明了语义映射的优点所在,但同时也列出了需要在将来的转换方法中解决的问题。但是,由于RDF与主题地图都有正式的数据模型,且在RDF Schema与OWL的帮助下,似乎大多数(如果不是所有的话)我们在这里列出的问题都可得到解决,而不必依靠对象映射提供的有限互用性。
责任编辑:张琎
查看本文的国际来源