|  |  |
|
난이도 : 고급 Andrew Matthews, 아키텍트 겸 개발자, 자유기고가
2008 년 8 월 26 일 웹의 미래에 대한 지식 중심 모델이라고 하는 시맨틱 웹(Semantic Web)에서는, 기계가 이해하고 처리할 수 있는 데이터를 인간이 읽을 수 있는 형태의 문서와 XML 메시지 형식으로 보완합니다. SQL이 관계형 데이터베이스와 관련된 것처럼 SPARQL(SPARQL Protocol and RDF Query Language)은 시맨틱 웹과 관련되어 있습니다. SPARQL은 애플리케이션이 분산 RDF 데이터베이스에 정교하고 복잡한 질의를 가능하게 해주며, 현재 이 세상에서 경쟁하고 있는 여러 프레임워크에서 폭넓게 지원됩니다. 이 튜토리얼에서는 가상의 회사를 설정하여 팀 추적 및 정보 관리 시스템을 예로 SPARQL의 사용법에 대해 알아봅니다.
시작하기 전에
이 튜토리얼은 시맨틱 웹 애플리케이션을 만들어본 경험이 전무한 개발자들을 위한 것이다. 프로그래밍 혹은 개발자용 도구는 하나도 필요없으나 웹이 뭔지는 어느 정도 알고 있다고 가정한다. 이 튜토리얼을 끝마칠 때 즈음에는 터틀(Turtle) 언어로 된 RDF 및 OWL 온톨로지(ontology)를 어떻게 만들어 내는지 알게 될 것이다. 그리고 제나(Jena)와 조세키(Joseki)를 사용하여 온톨로지를 어떻게 호스팅하고 SPARQL을 사용하여 어떻게 질의할지 알게 될 것이다.
이 튜토리얼에 대해
 |
자주 사용되는 약어들
- API: application programming interface
- DOM: Document Object Model
- FTP: File Transfer Protocol
- HTTP: Hypertext Transfer Protocol
- HTML: Hypertext Markup Language
- OWL: Web Ontology Language
- RDF: Resource Description Framework
- URI: Uniform Resource Identifier
- URL: Uniform Resource Locator
- W3C: World Wide Web Consortium
- XML: Extensible Markup Language
|
|
이 튜토리얼에서는 SPARQL과 기반 데이터 형식에 대해 소개한다. 또한 RDF, RDF 스키마(Schema), OWL, 터틀 지식 표현 언어에 대해서도 다룬다. 이러한 언어들을 이용하여 온톨로지 혹은 도메인 모델을 만든다. 이 튜토리얼 전반에 걸쳐 사용된 예제에서는 의미론적(semantically)으로 태그를 붙인 한 줄 짜리 블로그 서비스 류(역주: 미국의 twitter 류, 대한민국은 미투데이 류)와 비슷한 마이크로 블로그를 만들어 내기 위해 정보 관리 및 장부 기입 시스템에 대한 온톨로지와 질의를 만들 것이다. 여러분이 따내려는 프로젝트를 위해 팀을 꾸리고자 필요한 능력을 지닌 사람을 회사 내에서 찾기 위해 여러분은 이와 같은 블로그 목록을 질의할 것이다.
이 튜토리얼은 다음과 같은 단계를 따른다.
- RDF, OWL, SPARQL 등 시맨틱 웹에 대한 소개
- 조세키를 사용한 RDF 트리플 스토어(RDF Triple Store) 설정 방법
- 정보 관리 시스템을 위한 SPARQL 질의 작성
먼저 준비할 것들
이 튜토리얼을 계속해 나가려면 다음 도구들을 준비할 필요가 있다.
- 자바(Java™) 환경 — 자바 런타임 환경은 조세키와 SPARQL 서버를 구동하는 데 필요하다.
- 조세키(Joseki) — HP가 만든 오픈 소스 SPARQL 서버다. http://www.joseki.org/에서 얻을 수 있다. 소스포지(SourceForge)에서 다운로드 영역의 링크를 따라가기 바란다. 조세키 최신 버전을 다운로드한 후 unzip할 위치를 선택하여 풀어낸다. 서버를 구동할 간단한 배치 파일을 만들어야 하기 때문에 풀어낸 후 그 위치를 기억해두기 바란다.
- 제나(Jena) — 시맨틱 웹 프레임워크(조세키의 일부로 제공)
- 텍스트 편집기(어떤 것이든 상관 없음)
HP 연구소에서는 2003년 즈음부터 조세키를 개발해오고 있다. 조세키는 제나 시맨틱 웹 프레임워크에 HTTP를 지원하는 레이어다. 제나 역시 HP가 만들었다. 조세키는 아마도 시맨틱 웹 작업용으로서는 가장 대중적인 플랫폼일 것이다. 그리고 조세키 개발자 중 한 명이 SPARQL 표준의 편집 위원이기도 하다. 그렇다 보니 조세키가 표준에 뒤쳐질 일은 거의 없을 것이고 어떤 경우에 있어서는 새로운 아이디어에 대한 시험대 역할도 하고 있다.
나중에 조세키 설정 부분에서 여러분이 생성할 RDF 파일을 이용하여 조세키를 어떻게 설정할지 좀 더 자세히 살펴볼 수 있을 것이다.
|  |
|