지식 그래프란?
관련 엔티티의 모음을 나타내는 시맨틱 메타데이터 네트워크인 지식 그래프에 대해 알아봅니다.
검은색과 파란색 배경
지식 그래프란?

지식 그래프(시맨틱 네트워크라고도 함)는 실제 세계의 엔티티, 즉 오브젝트, 이벤트, 상황 또는 개념들의 네트워크를 나타내며 이들 사이에 존재하는 관계를 보여줍니다. 지식 "그래프"라는 용어로 표현하는 이유는 이 정보가 일반적으로 그래프 데이터베이스에 저장되고 그래프 구조로 시각화되기 때문입니다.

지식 그래프는 노드, 에지, 레이블의 세 가지 주요 구성요소로 구성됩니다. 모든 오브젝트, 장소 또는 사람이 노드가 될 수 있습니다. 에지는 노드 간의 관계를 정의합니다. 예를 들어 노드는 IBM과 같은 클라이언트, Ogilvy와 같은 에이전시가 될 수 있습니다. 에지는 IBM과 Ogilvy 간의 관계를 고객 관계로 분류합니다.

A는 주어, B는 술어, C는 목적어를 나타냅니다.

지식 그래프의 정의가 다양하다는 점도 주목할 가치가 있는데, 리서치(PDF, 183KB)(ibm.com 외부 링크)에서는 지식 그래프가 기술 자료나 온톨로지와 다르지 않다는 점을 시사하는데, 대신에 2012년 Google의 지식 그래프를 통해 이 용어가 대중화되었다고 주장합니다.

온톨로지

온톨로지는 지식 그래프라는 맥락에서 자주 언급되지만, 지식 그래프와 어떻게 다른지에 대해서는 여전히 논란이 있습니다. 궁극적으로 온톨로지는 그래프에서 엔티티의 공식적인 표현을 생성하는 역할을 합니다. 일반적으로 분류법에 기반하지만 여러 분류법을 포함할 수 있으므로 별도의 정의를 유지합니다. 지식 그래프와 온톨로지는 유사한 방법(노드와 에지 사용)으로 표현되고 리소스 정의 프레임워크(RDF) 트리플을 기반으로 하기 때문에 시각화 측면에서 서로 유사한 경향이 있습니다.

온톨로지의 예로 매디슨 스퀘어 가든(Madison Square Garden)과 같은 특정 장소를 조사하는 경우를 들 수 있습니다. 온톨로지는 시간과 같은 변수를 사용하여 해당 위치의 이벤트를 구분합니다. 뉴욕 레인저스(New York Rangers)와 같은 스포츠 팀은 시즌 중에 이 경기장에서 열리는 여러 게임에 참여하는데, 모두 하키 게임이며 모두 같은 장소에서 열립니다. 그러나 각 이벤트는 날짜와 시간으로 구분됩니다.

웹 온톨로지 언어(OWL)는 널리 채택된 온톨로지의 한 예이며, 인터넷의 수명을 위한 개방형 표준을 지지하는 국제 커뮤니티인 W3C(World Wide Web Consortium)에서 지원합니다. 궁극적으로 이러한 지식 조직은 사람과 서비스가 정보에 보다 효율적으로 액세스하고 처리할 수 있도록 지원하기 위해 존재하는 데이터베이스, API 및 머신 러닝 알고리즘과 같은 기술 인프라가 뒷받침합니다.

지식 그래프의 작동 원리

일반적으로 지식 그래프는 구조가 다른 다양한 소스의 데이터 세트로 구성됩니다. 스키마, ID 및 컨텍스트가 함께 작동하여 다양한 데이터에 구조를 제공합니다. 스키마는 지식 그래프에 대한 프레임워크를 제공하고, ID는 기본 노드를 적절하게 분류하며, 컨텍스트는 해당 지식이 존재하는 환경을 결정합니다. 이러한 구성요소는 여러 의미가 있는 단어를 구별하는 데 도움이 됩니다. 이를 통해 Google의 검색 엔진 알고리즘과 같은 제품이 브랜드인 Apple과 과일인 사과의 차이를 구분할 수 있습니다.

머신 러닝을 기반으로 하는 지식 그래프는 자연어 처리(NLP)를 활용하여 시맨틱 강화라는 프로세스를 통해 노드, 에지 및 레이블에 대한 포괄적인 뷰를 구성합니다. 데이터가 수집되면 이 프로세스를 통해 지식 그래프에서 개별 오브젝트를 식별하고 서로 다른 오브젝트 간의 관계를 파악합니다. 그런 다음 이 작업 지식을 관련성이 높고 본질적으로 유사한 다른 데이터 세트와 비교하고 통합합니다. 지식 그래프가 완성되면 질의 응답 및 검색 시스템에서 특정 쿼리에 대한 포괄적인 답변을 검색하고 재사용할 수 있습니다. 소비자용 제품은 시간을 절약하는 기능을 입증하지만 비즈니스 환경에도 적용되어 수동 데이터 수집 및 통합 작업을 제거함으로써 비즈니스 의사결정을 지원합니다.

지식 그래프를 중심으로 한 데이터 통합 작업은 이전에는 실현되지 않았을 수 있는 데이터 포인트 간의 연결을 설정하여 새로운 지식 생성을 지원할 수도 있습니다.

지식 그래프 적용사례

전사적 검색 시스템에 대한 사용자 기대치를 설정하는 다양한 소비자용 지식 그래프가 널리 사용되고 있습니다. 이러한 지식 그래프 중 일부를 소개합니다.

  • DBPedia 및 Wikidata는 Wikipedia.org의 데이터를 활용하는 서로 다른 유형의 두 가지 지식 그래프입니다. DBPedia는 Wikipedia 정보 상자의 데이터로 구성되는 반면 Wikidata는 보조 및 3차 오브젝트에 중점을 둡니다. 일반적으로 둘 다 RDF 형식으로 게시됩니다.  
  • Google 지식 그래프는 Google 검색결과 페이지(SERP)를 통해 표시되며 사람들이 검색하는 내용을 기반으로 정보를 제공합니다. 이 지식 그래프는 Freebase, Wikipedia, CIA World Factbook 등에서 데이터를 수집하는 5억 개 이상의 오브젝트로 구성됩니다.

그러나 지식 그래프는 다음과 같은 기타 산업에도 적용됩니다.

  • 소매: 지식 그래프는 업셀(up-sell) 및 크로스셀(cross-sell) 전략에 활용되며, 개인의 구매 행동과 인구통계학적 그룹 전반에서 인기 있는 구매 경향을 기반으로 제품을 추천합니다.
  • 엔터테인먼트: 지식 그래프는 Netflix, SEO 또는 소셜 미디어와 같은 콘텐츠 플랫폼을 위한 인공 지능(AI) 기반 추천 엔진에도 활용됩니다. 클릭 및 기타 온라인 참여 행동을 기반으로 이러한 제공자는 사용자가 읽거나 시청할 새 콘텐츠를 추천합니다.
  • 금융: 이 기술은 금융 업계 내 고객 유형 파악(KYC) 및 자금세탁방지 이니셔티브에도 사용되었습니다. 즉, 금융 범죄 예방 및 조사를 지원하여 은행 기관이 고객 전체의 자금 흐름을 이해하고 규정을 준수하지 않는 고객을 식별할 수 있도록 합니다.
  • 의료: 지식 그래프는 의료 연구 내에서 관계를 구성하고 분류함으로써 의료 산업에도 도움이 됩니다. 이 정보는 개인의 필요에 따라 진단을 검증하고 치료 계획을 식별함으로써 의료진을 지원합니다.  
관련 솔루션
IBM Cloud

IBM Cloud는 Red Hat과 함께 클라우드와 AI의 잠재력을 최대한 실현하기 위해 시장을 선도하는 보안, 엔터프라이즈 확장성, 개방형 혁신을 제공합니다.

IBM Cloud 살펴보기
IBM Watson 제품

Watson AI를 사용하여 애플리케이션에 AI를 적용하여 보다 정확한 예측을 수행합니다.

IBM Watson 제품 살펴보기
IBM Watson Studio

AI 모델을 구축, 실행 및 관리합니다. 오픈 소스 코드 또는 비주얼 모델링을 사용하여 임의의 클라우드에서 데이터를 준비하고 모델을 구축합니다. 결과를 예측하고 최적화합니다.

IBM Watson Studio 살펴보기
다음 단계

IBM Cloud, Watson 서비스, Watson Studio 및 오픈 소스 기술을 사용하여 엔터프라이즈 지식 그래프 이니셔티브를 지원할 수 있습니다.문서에서 직접 지식 그래프를 만들고 다양한 비즈니스 도메인에서 생성된 비정형 텍스트 컨텐츠에서 인사이트를 얻습니다.

지금 IBM Cloud 계정 만들기