本文へジャンプ

「送信する」をクリックすることにより、お客様は developerWorks のご使用条件に同意したことになります。 ご使用条件を読む


お客様が developerWorks に初めてサインインすると、プロフィールが作成されます。プロフィールで選択した情報は公開されますが、いつでもその情報を編集できます。お客様の姓名(非表示設定にしていない限り)とディスプレイ・ネームは、投稿するコンテンツと一緒に表示されます。

送信されたすべての情報は安全です。

  • 閉じる [x]

developerWorks に初めてサインインするとプロフィールが作成されますので、その際にディスプレイ・ネームを選択する必要があります。ディスプレイ・ネームは、お客様が developerWorks に投稿するコンテンツと一緒に表示されます。

ディスプレイ・ネームは、3文字から31文字の範囲で指定し、かつ developerWorks コミュニティーでユニークである必要があります。また、プライバシー上の理由でお客様の電子メール・アドレスは使用しないでください。

「送信する」をクリックすることにより、お客様は developerWorks のご使用条件に同意したことになります。 ご使用条件を読む


送信されたすべての情報は安全です。

  • 閉じる [x]

XML的思索 第9回: ナレッジ管理のための基本的なXMLおよびRDF技法

その5: RDFおよびDAML+OILスキーマの定義

Uche Ogbuji (uche@ogbuji.net), Consultant, Fourthought, Inc.
Uche photo
Uche Ogbuji氏は、Fourthought, Inc. のコンサルタント兼共同設立者です。この会社は、企業のナレッジ・マネジメントのためのXMLソリューションを専門とするソフトウェア・ベンダー兼コンサルタント会社です。Fourthoughtでは、XML、RDF、およびナレッジ・マネジメント・アプリケーション用のオープン・ソース・プラットフォームである4Suiteを開発しています。Ogbuji氏は、ナイジェリア出身のコンピューター・エンジニア兼ライターで、現在は、米国コロラド州ボールダーに住み、そこで働いています。Ogbuji氏の連絡先はuche.ogbuji@fourthought.com です。

概要: 今回、Uche Ogbuji氏は、問題追跡アプリケーションのRDFおよびDAML+OILスキーマの定義をします。同時にモデル化についての説明も継続します。

日付:  2002年 3月 01日
レベル:  初級 この記事の原文:  英語
アクティビティー: 2562 ビュー
お気軽にご意見・ご感想をお寄せください: 


前回のこのコラムでは、RDFなどのXMLナレッジ管理システムが、データの設計やモデル化に関する古くからの問題に対して、どのように新しい光を投げかけるかについて説明しました。その際に、問題追跡パッケージのスキーマを明確にすることを目標にしましたが、このパッケージとは、XMLアプリケーションと連携してRDFの使用方法を説明するために取り上げたものです。今回は、RDFSおよびDAML+OIL形式について、問題追跡スキーマの定義を完成させようと思います。

今回も、RDF、RDFS、およびDAML+OILに関する知識が必要です。しかし、前回から同僚のRoxane Ouelletと共にDAML+OILの概要を説明しているので (参考文献を参照)、これらを理解するために難解な仕様書と格闘する必要はなくなったはずです。

先を急ぎましょう

前置きはこれくらいにして、リスト1に問題追跡アプリケーションの完全なRDFSを示します。



リスト1. 問題追跡アプリケーションのRDFSスキーマ
                
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE rdf:RDF [
<!ENTITY rdf "http://www.w3.org/1999/02/22-rdf-syntax-ns#">
<!ENTITY rdfs "http://www.w3.org/2000/01/rdf-schema#">
<!ENTITY it "http://rdfinference.org/schemata/issue-tracker/">
<!ENTITY dc "http://purl.org/dc/elements/1.1/">
]>
<rdf:RDF
xmlns:rdf="&rdf;"
xmlns:rdfs="&rdfs;"
xmlns:it="&it;"
>
<rdfs:Class rdf:about="&it;Catalog">
<rdfs:label>Issue catalog</rdfs:label>
<rdfs:comment>
An optional collection of resources for which issues have or can
be defined.  Use dc:relation to associate the catalog with its
resources.
</rdfs:comment>
</rdfs:Class>
<rdfs:Class rdf:about="&it;Issue">
<rdfs:label>Issue</rdfs:label>
<rdfs:comment>
A problem, suggestion or other matter for action or discussion
relevant to a resource.  Use Dublin Core properties for base
description.
</rdfs:comment>
</rdfs:Class>
<rdfs:Property rdf:about="&it;issue">
<rdfs:label>issue</rdfs:label>
<rdfs:comment>Associate an issue to its resources</rdfs:comment>
<rdfs:range rdf:resource="&it;Issue"/>
</rdfs:Property>
<rdfs:Property rdf:about="&it;action">
<rdfs:label>action</rdfs:label>
<rdfs:comment>Associate an action with an issue</rdfs:comment>
<rdfs:domain rdf:resource="&it;Issue"/>
<rdfs:range rdf:resource="&it;Action"/>
</rdfs:Property>
<rdfs:Class rdf:about="&it;Action">
<rdfs:label>Action</rdfs:label>
<rdfs:comment>
An action to be taken with regard to an issue
</rdfs:comment>
</rdfs:Class>
<rdfs:Class rdf:about="&it;it:assignee">
<rdfs:label>Assign to</rdfs:label>
<rdfs:comment>
Specify the party to whom the action is assigned
</rdfs:comment>
<rdfs:domain rdf:resource="&it;Action"/>
</rdfs:Class>
<rdfs:Class rdf:about="&it;status">
<rdfs:label>status</rdfs:label>
<rdfs:comment>For instance, "not done" or "done"</rdfs:comment>
<rdfs:domain rdf:resource="&it;Action"/>
</rdfs:Class>
<rdfs:Class rdf:about="&it;comment">
<rdfs:label>comment</rdfs:label>
<rdfs:comment>Associate a comment with an issue</rdfs:comment>
<rdfs:domain rdf:resource="&it;Issue"/>
<rdfs:range rdf:resource="&it;Comment"/>
</rdfs:Class>
<rdfs:Class rdf:about="&it;Comment">
<rdfs:label>Comment</rdfs:label>
<rdfs:comment>A comment made with regard to an issue</rdfs:comment>
</rdfs:Class>
</rdf:RDF>

使用されている名前空間が変更されているなど、いくつかの変更点に気付かれたと思います。これらの変更が行われた理由は、残念ながら、これまでのRDFのサンプルに定義済みクラスが使用されていなかったという事実ほど簡単に説明することはできません。このスキーマは、さまざまな理由で行われた変更を含め、RDFInference.orgの問題追跡アプリケーションのために現在何が使用されているかを示しています。これに対応する、インスタンスRDFのアップデートを次に示します。

また、語彙に関するいくつかの約束事(convention)も採用しています。第1に、すべての名前空間URIをDTD内部部分集合のエンティティーとして定義しています (Ms. Ouelletから教わった約束事です)。これによりエラーが減少し、読み易さが向上します。第2に、rdf:about だけを使用し、rdf:ID は使用していません。rdf:IDとは、格納するドキュメントの想定されるURIに対して、IDを解決することに関連して、ありとあらゆる落とし穴に落ちてヒドイ目にあった経験から、最近採用した約束事です。次の点に注意してください。すなわち、rdf:ID は、明示的なxml:base 宣言が存在することをが確かな場合のみ使用していることと、相互運用性が必要とされるすべてのRDFプロセッサーはXMLベースをサポートしていることです。

Catalog クラスは、問題を持つすべてのリソース、あるいはユーザーが問題を作成できるすべてのリソースを集約するための方法を提供します。これは、主にアプリケーションを使いやすくするために用意されています。追跡アプリケーション用のWebベースのフォームを考えてみましょう。このフォームには、関心のあるリソースを選択するためのドロップダウン・ボックスがあることでしょう。このリストを表示するための1つの方法は、所定のカタログからdc:relation ステートメントのすべてのオブジェクトをチェックすることです。なお、これから紹介するDAML+OILスキーマでは、別のアプローチを採用しています。

これ以外にも、いくつかの小さな変更があります。たとえば、品詞の使用に、より一貫性を持たせるため、"assigned-to" から "assignee" に改名しています。それ以外には、このスキーマには特にわかりにくい点はないと思います。それでは、DAML+OILバージョンを見てみましょう。


DAMLヤンキー

DAML+OILはRDFSに対する重要な改善を施すスキーマ・システムです。これには、組み込みのデータ型付けシステム、列挙のサポート、プロパティーに関する特化、および推論による分類と型付けが含まれています。また、存在論を定義するために単なる図式を超えていますが、これは私たちの概念の保持のしかた近似となるように意図されています。しかし、ここでは主に基本的な図式的機能を使用することにします。リスト2は、リスト1と同様の、問題追跡アプリケーションのDAML+OILスキーマです。


リスト2. 問題追跡アプリケーションのDAML+OILスキーマ
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE rdf:RDF [
<!ENTITY rdf "http://www.w3.org/1999/02/22-rdf-syntax-ns#">
<!ENTITY xsd "http://www.w3.org/2000/10/XMLSchema#">
<!ENTITY rdfs "http://www.w3.org/2000/01/rdf-schema#">
<!ENTITY daml "http://www.daml.org/2001/03/daml+oil#">
<!ENTITY dc "http://purl.org/dc/elements/1.1/">
<!ENTITY it "http://rdfinference.org/schemata/issue-tracker/">
]>
<rdf:RDF
xmlns:rdf="&rdf;"
xmlns:rdfs="&rdfs;"
xmlns:daml="&daml;"
xmlns:xsd="&xsd;"
xmlns:it="&it;"
>
<daml:Ontology rdf:about="">
<daml:versionInfo>
<!-- Note: requires expansion by RCS, CVS or the like
$Revision$
</daml:versionInfo>
<rdfs:comment>
Ontology for an issue tracking system for arbitrary resources
</rdfs:comment>
<daml:imports rdf:resource="http://www.w3.org/2001/10/daml+oil"/>
</daml:Ontology>
<daml:Class rdf:about="&it;RelevantResource">
<rdfs:label>Relevant resource</rdfs:label>
<rdfs:comment>
An implied classification of resources that have related issues
</rdfs:comment>
<rdfs:subClassOf>
<daml:onProperty rdf:resource="&it;issue"/>
<daml:toClass rdf:resource="&it;Issue"/>
</rdfs:subClassOf>
</daml:Class>
<daml:Class rdf:about="&it;Issue">
<rdfs:label>Issue</rdfs:label>
<rdfs:comment>
A problem, suggestion or other matter for action or discussion
relevant to a resource.  Use Dublin Core properties for base
description.
</rdfs:comment>
</daml:Class>
<daml:ObjectProperty rdf:about="&it;issue">
<rdfs:label>issue</rdfs:label>
<rdfs:comment>Associate an issue to its resources</rdfs:comment>
<rdfs:range rdf:resource="&it;Issue"/>
</daml:ObjectProperty>
<daml:ObjectProperty rdf:about="&it;action">
<rdfs:label>action</rdfs:label>
<rdfs:comment>Associate an action with an issue</rdfs:comment>
<rdfs:domain rdf:resource="&it;Issue"/>
<rdfs:range rdf:resource="&it;Action"/>
</daml:ObjectProperty>
<daml:Class rdf:about="&it;Action">
<rdfs:label>Action</rdfs:label>
<rdfs:comment>An action to be taken with regard to an
issue</rdfs:comment>
</daml:Class>
<daml:ObjectProperty rdf:about="&it;it:assignee">
<rdfs:label>Assign to</rdfs:label>
<rdfs:comment>
Specify the party to whom the action is assigned
</rdfs:comment>
<rdfs:domain rdf:resource="&it;Action"/>
</daml:ObjectProperty>
<daml:ObjectProperty rdf:about="&it;status">
<rdfs:label>status</rdfs:label>
<rdfs:comment>For instance, "not done" or "done"</rdfs:comment>
<rdfs:domain rdf:resource="&it;Action"/>
</daml:ObjectProperty>
<daml:ObjectProperty rdf:about="&it;comment">
<rdfs:label>comment</rdfs:label>
<rdfs:comment>Associate a comment with an issue</rdfs:comment>
<rdfs:domain rdf:resource="&it;Issue"/>
<rdfs:range rdf:resource="&it;Comment"/>
</daml:ObjectProperty>
<daml:Class rdf:about="&it;Comment">
<rdfs:label>Comment</rdfs:label>
<rdfs:comment>A comment made with regard to an issue</rdfs:comment>
</daml:Class>
</rdf:RDF>

すべての定義の前にontologyヘッダーが置かれています。これはドキュメントを記述し、スキーマを指定するDAML規約です (そのため空であるrdf:aboutが定義され、これによってドキュメント自身をサブジェクトに設定します)。このヘッダーには改訂ステートメントを備え、このステートメントは改訂制御システムによって展開できるようにキーワードを使用して定義されています。また、インポートも記述されています。これは、他のファイルの定義を現在のファイルに組み込むためにDAML+OILで追加された明示的機構です (DAML以前には、複数のソースを1つのモデルにマージするか、XIncludeなどの低レベルの機構を使用しなければなりませんでした)。標準的な方法としては、コアDAML+OILスキーマをインポートし、DAML+OIL固有のリソースの定義を追加します。

次に、特別なクラスであるRelevantResource が記述されています。このインスタンスは明示的には記述されていませんが、インスタンスのプロパティーに関する推論によって定義されます。このことは、RelevantResource クラスをより詳しく調べることで明らかになります。このクラスは、無名のインライン・リソースのサブクラスとして定義されており、このサブクラスの型はdaml:Restriction です。これはインスタンスが持つプロパティーとその値によってルールを定義できる、DAML+OILの特別な機構です。ここでは制限により、値がIssue クラスであるissue プロパティーを持つすべてのリソースが選択されます。この制限からのサブクラス化により、RelevantResource クラスは、制限を満たすすべてのリソースのセットを含んだ、一種の仮想クラスとなります。あるリソースが正しいクラスの値を持つ正しいプロパティーを取得した場合、そのリソースは、明示的な記述がなかったとしても、いつでも自動的にこの仮想クラスのメンバーとなります。

これは、運用している情報空間のすべてを制御できるわけではない場合には非常に重要な機能であり、また、Semantic Webを支えるために必要な技術の一つとして、DAML+OILが大きな前進であるといえる理由です。ここでのより控えめな例では、この機能によって、問題追跡のために明示的に登録されたリソースを、すべて持つ必要はなくなりました。RDFS形式のスキーマでは、Catalog クラスを使用して、すべてのリソースを保持する必要がありましたが。

すべてのクラスはdaml:Class を使用して定義されています。daml:Classは、DAMLで導入されたすべての追加機能を提供するrdfs:Class クラスのサブクラスです。同様に、プロパティーの定義にはdaml:ObjectProperty を使用しています。問題追跡スキーマでは、プロパティーの値を定義するために特定のデータ型 (文字列、整数など) は使用しませんが、これらのプロパティーは、DAML+OILではdaml:DatatypeProperty のサブクラスとなるように定義されていることに注意してください。

実のところ、RDFInference.orgアプリケーションではDAML+OILスキーマが使用されており、またこのコラムでもこのスキーマを基礎として使用して作業を継続していきます。


インスタンスのアップデート

すでに述べた変更のため、このコラムでこれまで検討してきた問題のサンプル・インスタンスを再び取り上げ、アップデートしました。リスト3をご覧ください。


リスト3. アップデートされたインスタンス・データ
<?xml version='1.0'?>
<!DOCTYPE rdf:RDF [
<!ENTITY rdf "http://www.w3.org/1999/02/22-rdf-syntax-ns#">
<!ENTITY rdfs "http://www.w3.org/2000/01/rdf-schema#">
<!ENTITY daml "http://www.daml.org/2001/03/daml+oil#">
<!ENTITY dc "http://purl.org/dc/elements/1.1/">
<!ENTITY foaf "http://xmlns.com/foaf/0.1/">
<!ENTITY it "http://rdfinference.org/schemata/issue-tracker/">
<!ENTITY rit "http://rdfinference.org/ril/issue-tracker/">
]>
<rdf:RDF
xmlns:rdf="&rdf;"
xmlns:rdfs="&rdfs;"
xmlns:daml="&daml;"
xmlns:rit="&rit;"
xmlns:it="&it;"
xmlns:dc="&dc;"
xmlns:foaf="&foaf;"
xmlns="&it;"
>
<rdf:Description rdf:about='http://rdfinference.org/ril/ril-20010502'>
<issue rdf:resource='&rit;i2001030423'/>
<issue rdf:resource='&rit;i2001042003'/>
</rdf:Description>
<Issue rdf:about='&rit;i2001030423'>
<dc:title>Unnecessary abbreviation</dc:title>
<dc:creator rdf:resource='mailto:Alexandre.Fayolle@logilab.fr'/>
<dc:description>
Is the abbreviation of rdf:type predicates in queries necessary?
</dc:description>
<dc:date>2001-03-04</dc:date>
<comment rdf:parseType="Resource">
<dc:creator rdf:resource='mailto:Alexandre.Fayolle@logilab.fr'/>
<dc:description>
The abbreviation in listing 8 doesn't seem necessary to Nico
Chauvat or me.
</dc:description>
</comment>
<action rdf:parseType="Resource">
<dc:description>Organize a vote on this topic</dc:description>
<it:assignee rdf:resource='mailto:uche.ogbuji@fourthought.com'/>
</action>
</Issue>
<Issue rdf:about='&rit;i2001042003'>
<dc:title>Inconsistent versioning</dc:title>
<dc:creator rdf:resource='mailto:Nicolas.Chauvat@logilab.fr'/>
<dc:description>
The RIL versioning is not clear (there's a mix of 0.1, 0/1, 0.2
and 0/2)
</dc:description>
<dc:date>2001-04-20</dc:date>
<action rdf:parseType="Resource">
<dc:description>
Correct all to use the "0/1" form in the next draft.
</dc:description>
<it:assignee rdf:resource='mailto:uche.ogbuji@fourthought.com'/>
</action>
</Issue>
<rdf:Description rdf:about='mailto:Alexandre.Fayolle@logilab.fr'>
<foaf:name>Alexandre Fayolle</foaf:name>
</rdf:Description>
<rdf:Description rdf:about='mailto:uche.ogbuji@fourthought.com'>
<foaf:name>Uche Ogbuji</foaf:name>
</rdf:Description>
<rdf:Description rdf:about='mailto:Nicolas.Chauvat@logilab.fr'>
<foaf:name>Nicolas Chauvat</foaf:name>
</rdf:Description>
</rdf:RDF>

サンプルの問題に対応するリソースを定義します。DAML+OILスキーマに従い、http://rdfinference.org/ril/ril-20010502 は自動的にRelevantResource クラスのメンバーになります。もう1つの重要な変更は、mailtoのURLを使用して他の人々を参照していることです。そして、このURLは「friend of a friend」(FOAF) を使用して、これらの人々の正規の名前にリンクされています。FOAFは、個人的な連絡先に関する情報を指定するための有名なDAML+OILスキーマで、電子メールボックスに関係付けられている可能性のある人物を記述するのに適しています。RDFで連絡先情報をモデル化する方法には、有名なもう1つの方法があることに注意してください。それは、連絡先情報を電子メールの添付ファイルとして埋め込むための、一般的なvCard形式に基づくものです。vCard RDFスキーマは、FOAFスキーマよりも広い範囲で使用されていますが、ここでは、その追加プロパティーは必要ありません。また、必要であれば、FOAFベースのオプションとしてFOAFCorpも利用できます。これは、企業の組織構成に関連する要素をFOAFでコア・パーソナル・プロファイル情報に追加するものです。

オリジナルではなく、このフォームを生成するための、XSLTに対する変更は、あまり重要ではありません。ほとんどはリテラルの結果要素名や名前空間URIに対する変更です。


結論

一般に、前回のこのコラムで説明したような、緩やかな方法で制約を適用する場合でも、なんらかのスキーマを定義しておく必要があります。特に役に立たないとしても、ドキュメンテーションにはなります。RDFSは最も単純で最も普及している選択肢ですが、DAML+OILには、追加機能だけでなく、コア・セマンティクスがよりクリーンであることなど、推奨に値する点がいくつもあります。問題追跡アプリケーションのスキーマが完成したので、今度は問い合わせの構成方法を改善しましょう。このコラムではVersaに注目します。これはRDF用のオープンな問い合わせ言語で、これまでに示したすべての問い合わせコードをより単純に、より高速にしてくれます。


参考文献

著者について

Uche photo

Uche Ogbuji氏は、Fourthought, Inc. のコンサルタント兼共同設立者です。この会社は、企業のナレッジ・マネジメントのためのXMLソリューションを専門とするソフトウェア・ベンダー兼コンサルタント会社です。Fourthoughtでは、XML、RDF、およびナレッジ・マネジメント・アプリケーション用のオープン・ソース・プラットフォームである4Suiteを開発しています。Ogbuji氏は、ナイジェリア出身のコンピューター・エンジニア兼ライターで、現在は、米国コロラド州ボールダーに住み、そこで働いています。Ogbuji氏の連絡先はuche.ogbuji@fourthought.com です。

不正使用の報告のヘルプ

不正使用の報告

ありがとうございます。 このエントリーは、モデレーターの注目フラグが設定されました。


不正使用の報告のヘルプ

不正使用の報告

不正使用の報告の送信に失敗しました。


developerWorks: サイン・イン


IBM ID が必要ですか?
IBM IDをお忘れですか?


パスワードをお忘れですか?
パスワードの変更

「送信する」をクリックすることにより、お客様は developerWorks のご使用条件に同意したことになります。 利用条件

 


お客様が developerWorks に初めてサインインすると、プロフィールが作成されます。 プロフィールで選択した情報は公開されますが、いつでもその情報を編集できます。 お客様の姓名(非表示設定にしていない限り)とディスプレイ・ネームは、投稿するコンテンツと一緒に表示されます。

表示名をお選びください

developerWorks に初めてサインインするとプロフィールが作成されますので、その際にディスプレイ・ネームを選択する必要があります。ディスプレイ・ネームは、お客様が developerWorks に投稿するコンテンツと一緒に表示されます。

ディスプレイ・ネームは、3文字から31文字の範囲で指定し、かつ developerWorks コミュニティーでユニークである必要があります。また、プライバシー上の理由でお客様の電子メール・アドレスは使用しないでください。

(半角英数字で3文字以上31文字以下にする必要があります)


「送信する」をクリックすることにより、お客様は developerWorks のご使用条件に同意したことになります。 利用条件

 


この記事を評価する

コメント

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=60
Zone=XML
ArticleID=242308
ArticleTitle=XML的思索 第9回: ナレッジ管理のための基本的なXMLおよびRDF技法
publish-date=03012002
author1-email=uche@ogbuji.net
author1-email-cc=

タグ

Help
このタグで、My developerWorks のすべてのタイプのコンテンツを見つけるために検索フィールドを使用します。

スライダーバーを使用することで、より多く(少なく)タグを表示します。

人気のタグは、この特定のコンテンツ・ゾーン(例えば、Java テクノロジー、Linux や WebSphere など)に対するトップのタグを表示します。

マイ・タグは、この特定のコンテンツ・ゾーン(例えば、Java テクノロジー、Linux や WebSphere など)に対するお客様ご自身のタグを表示します。

このタグで、My developerWorks のすべてのタイプのコンテンツを見つけるために検索フィールドを使用します。人気のタグは、この特定のコンテンツ・ゾーン(例えば、Java テクノロジー、Linux や WebSphere など)に対するトップのタグを表示します。マイ・タグは、この特定のコンテンツ・ゾーン(例えば、Java テクノロジー、Linux や WebSphere など)に対するお客様ご自身のタグを表示します。