Стандарты связанных данных

Стандарты IBM

Концепции связанных данных и семантического Web (Semantic Web) всегда привлекали внимание исследовательской группы IBM. В настоящее время связанные данные стали центральным компонентом стратегии некоторых продуктов IBM. Уже несколько лет группа IBM Rational использует чтение/запись связанных данных в качестве архитектурного метода интеграции пакетов приложений, и мы уже выпускаем коммерческие продукты, использующие эту технологию. Приложения, которые мы интегрируем в IBM, в первую очередь относятся к сегментам управления жизненным циклом приложений (ALM) и управления системами интеграции (ISM), но мы уверены, что применение чтения/записи связанных данных для интеграции приложений найдет широкое применение во всей ИТ индустрии. В настоящее время IBM совместно с консорциумом W3C работает над формальным определением стандарта связанных данных для создания в промышленности системы стандартов, введение которой положительно отразится как на небольших браузерных приложениях (WebApps), так и на крупных проектах по интеграции приложений (EAI).

Арно Ле Ор, архитектор программных стандартов, руководитель отдела стандартов связанных данных, IBM

Арно Ле Ор — член группы программных стандартов IBM, отвечает за координацию работы нескольких групп стандартизации IBM со стратегической и тактической точек зрения. 15 лет работает с открытыми стандартами в качестве сотрудника X Consortium и W3C, а также представителя IBM. Принимал участие во всех аспектах процесса разработки стандартов, включая технические, стратегические, политические и юридические, в качестве как внешнего эксперта, так и сотрудника различных организаций по стандартизации и компаний, в том числе IBM. Арно принимал участие в разработке таких стандартов, как HTML и XML, и был одним из ведущих архитекторов Xerces — анализатора XML, разработанного организацией Apache Software Foundation. В настоящее время Арно руководит отделом стандартов связанных данных корпорации IBM.



27.07.2012

Обзор

Тим Бернерс-Ли (Tim Berners-Lee) предложил идею связанных данных на основе четырех принципов, стимулирующих применение базовых принципов Web для доступа к данным:

  1. Применение универсальных идентификаторов ресурсов (URI) в качестве имен объектов
  2. Применение HTTP URI для реализации возможности обращения по этим именам
  3. Предоставление полезной информации тому, кто обращается по URI, с помощью стандартов (RDF*, SPARQL)
  4. Включение ссылок на другие URI, позволяющих найти дополнительную информацию

В качестве модели данных (а не только формата) для связанных данных используется RDF, а в качестве протокола — HTTP, аналогично тому, как Web-страницы строятся с помощью HTML, HTTP и URL.

Связанные данные приобрели большую популярность в качестве технологии публикации данных в Интернете. В настоящий момент в форме связанных данных доступно довольно много данных, например, DBpedia, и если к таким данным открыт свободный доступ, их называют открытыми связанными данными. Связанные данные также могут использоваться в качестве архитектурного метода интеграции приложений или интеграции данных в рамках предприятия.

Используемая в технологии связанных данных мощная распределенная открытая модель графических данных делает эту технологию очень удобной для интеграции данных, хранящихся в различных базах данных и файловых системах, а также для интеграции приложений вокруг этих данных.

Ниже перечислены некоторые возможности, благодаря которым связанные данные становятся очень удобным инструментом интеграции:

  • Единый интерфейс (определенный методами HTTP), универсально понимаемый и неизменный для всех приложений, в противоположность архитектуре удаленного вызова процедур (RPC), где каждое приложение имеет уникальный интерфейс, который нужно изучить и запрограммировать.
  • Универсальная схема адресации (благодаря HTTP URL) как для идентификации, так и для доступа ко всем “объектам”, в отличие от архитектуры RPC, в которой отсутствуют единые способы идентификации и доступа к данным.
  • Простая и в то же время расширяемая модель данных (благодаря RDF) для описания ресурсов, которое не требует предварительного изучения специальной терминологии.

Связанные данные опираются на существующую инфраструктуру Интернета и обладают набором уникальных характеристик, таких как распределенность и масштабируемость.


Базовый профиль связанных данных

В декабре 2011 года консорциум W3C провел семинар по изучению шаблонов связанных данных корпоративного уровня, по результатам которого было принято решение о запуске соответствующего официального проекта в W3C. Участники семинара пришли к единодушному мнению, что "W3C должен сформировать рабочую группу для выработки Рекомендаций W3C, определяющих Платформу связанных данных [...], в которых [предположительно] будут перечислены спецификации, составляющие основу связанных данных, и, при необходимости, некоторые дополнительные спецификации, охватывающие такие аспекты, как верстка".

В марте 2012 года в качестве первого шага компания IBM передала консорциуму W3C спецификацию Linked Data Basic Profile 1.0. Эта спецификация была разработана при участии EMC, Oracle, Red Hat, DERI, SemanticWeb.com, а также Siemens и Cambridge Semantics.

Базовый профиль связанных данных основан на уроках, извлеченных из инициативы IBM Open Services Lifecycle Collaboration (OSLC). Он определяет набор передовых методов и простой подход к построению архитектуры чтения-записи связанных данных на основе HTTP-доступа к веб-ресурсам, который описывает их состояние с помощью RDF. Спецификация опирается на четыре принципа Тима Бернерса-Ли и предлагает ряд новых правил, а также пояснения и расширения, позволяющие достичь большей совместимости между разными реализациями связанных данных.

Предложенная новая рабочая группа W3C под названием Linked Data Platform должна будет выработать Рекомендации W3C для шаблонов интеграции приложений на основе HTTP (RESTful), использующих чтение/запись связанных данных, причем в качестве стартовой точки будут использоваться документы, полученные от IBM.


Сценарии применения

Технологии связанных данных могут использоваться разными способами.

  1. Связанные данные можно использовать для раскрытия информации через URL — например, документов публичного характера — в Интернете в машиночитаемом формате.
  2. Связанные данные можно использовать для извлечения новой информации из уже существующей, например, в фармацевтических приложениях или в IBM Watson.
  3. Связанные данные можно использовать для интеграции. Так, группа IBM Rational использует связанные данные в качестве архитектурной модели и технологии реализации для интеграции приложений в сфере управления жизненным циклом продуктов и приложений (ALM), а подразделение Tivoli на данный момент использует их для управления интегрированными системами.

RDF может моделировать ресурсы и их взаимоотношения, так что в ALM запрос на изменение становится ресурсом, раскрываемым как RDF. Запрос на изменение можно связать с дефектом, который он должен устранить, и с тестом, который будет использован для проверки этого изменения. Благодаря связанным данным средства управления изменениями, дефектами и испытаниями больше не взаимодействуют друг с другом через специальные интерфейсы, а непосредственно обращаются к ресурсам, следуя принципам связанных данных.

Ресурсы

Комментарии

developerWorks: Войти

Обязательные поля отмечены звездочкой (*).


Нужен IBM ID?
Забыли Ваш IBM ID?


Забыли Ваш пароль?
Изменить пароль

Нажимая Отправить, Вы принимаете Условия использования developerWorks.

 


Профиль создается, когда вы первый раз заходите в developerWorks. Информация в вашем профиле (имя, страна / регион, название компании) отображается для всех пользователей и будет сопровождать любой опубликованный вами контент пока вы специально не укажите скрыть название вашей компании. Вы можете обновить ваш IBM аккаунт в любое время.

Вся введенная информация защищена.

Выберите имя, которое будет отображаться на экране



При первом входе в developerWorks для Вас будет создан профиль и Вам нужно будет выбрать Отображаемое имя. Оно будет выводиться рядом с контентом, опубликованным Вами в developerWorks.

Отображаемое имя должно иметь длину от 3 символов до 31 символа. Ваше Имя в системе должно быть уникальным. В качестве имени по соображениям приватности нельзя использовать контактный e-mail.

Обязательные поля отмечены звездочкой (*).

(Отображаемое имя должно иметь длину от 3 символов до 31 символа.)

Нажимая Отправить, Вы принимаете Условия использования developerWorks.

 


Вся введенная информация защищена.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=40
Zone=SOA и web-сервисы
ArticleID=827874
ArticleTitle=Стандарты связанных данных
publish-date=07272012