Watson Discovery 기능

지속적인 관련성 훈련

자세히 보기

Discovery가 자동으로 연관성이 가장 높은 답변을 지속적으로 학습하도록 할 수 있습니다. 사용자 상호작용으로부터 자동으로 학습하기 때문에 수동으로 Discovery 관련성 훈련을 수행하기 위해 시간과 노력을 들일 필요가 없습니다. 대표성 높은 모델에 맞게 인공적으로 구성한 훈련 세트가 아니라 실제 사용 데이터로 훈련합니다. 데이터 및 용도가 변경되어도 자동으로 훈련이 업데이트되므로 새 훈련 데이터를 수동으로 작성할 필요가 없습니다.

Watson 추천

자세히 보기

사전 예방적으로 Discovery 애플리케이션의 성능을 모니터링하고 향상시킵니다. 이 새로운 기능을 통해 총 조회 수, 상위 키워드 등 문서 검색에 대한 정량적 지표와 시간에 따른 지표의 트렌드를 상세히 살펴보고 새 콘텐츠 추가, 동의어 정의, 추가 훈련 수행 등을 통해 성능을 향상시킬 수 있습니다.

가리키고 클릭하기

자세히 보기

최신 프레임워크에서는 코드 없는 연결이 지원됩니다. 분석할 데이터 소스를 Discovery 툴 UI에서 간단한 가리키고 클릭하기 기능으로 선택하기만 하면 됩니다. 여러 분산된 소스의 데이터를 통합할 수 있으며, 현재 이 기능이 지원되는 소스로는 Box, Sharepoint, Salesforce가 있습니다. 곧 데이터베이스, 웹 사이트, 콘텐츠 관리 시스템을 비롯한 20개가 넘는 추가 소스로 지원이 확대될 것입니다.

임베드된 NLP

자세히 보기

Watson Discovery에서는 자연어 처리 기능이 기본적으로 제공됩니다. 간단히 몇 가지 옵션을 선택하기만 하면 정서, 엔티티, 개념, 시맨틱 역할 등을 추출할 수 있습니다.

관련성 훈련

자세히 보기

말뭉치에 대한 조회 결과의 관련성이 향상되도록 Discovery 서비스를 훈련시킬 수 있습니다. Discovery에 훈련 데이터를 제공하면 이 서비스는 머신 러닝 Watson 기술을 사용하여 콘텐츠 및 질문에서 신호를 찾아냅니다. 그런 다음, 서비스가 결과를 다시 정렬하여 연관성이 가장 높은 결과를 맨 위에 표시합니다. 훈련 데이터를 더 추가하면 서비스에서 리턴하는 결과의 순서가 더욱 정확하고 정교해집니다.

도메인 사용자 정의

자세히 보기

Discovery가 도메인별로 고유한 용어를 이해하도록 훈련시킬 수 있습니다. Watson Knowledge Studio로 구축된 사용자 정의 머신 러닝 모델을 통해 말뭉치 인리치먼트를 사용자 정의하기만 하면 됩니다.

구절 검색

자세히 보기

구절 검색은 텍스트 말모듬으로 정의된 검색 기준을 충족하는 특정 구절을 사용자에게 리턴하는 옵션을 제공합니다.

문서 유사성

자세히 보기

문서 유사성을 사용하면 알려진 문서 ID를 제공할 수 있으며 Discovery가 이 문서를 분석하고 문서의 가장 중요한 측면을 이해하여 컬렉션에서 텍스트가 유사한 문서를 찾습니다.

이상 항목 발견

자세히 보기

이상 항목 발견 기능은 시계열 내에서 특이한 데이터 점을 찾아 추가 검토를 위한 플래그를 지정하는 데 사용됩니다. 이상 항목 발견 기능이 사용되는 예로는 뉴스 알람 식별, 이벤트 발견, 트렌드 찾기 등이 있습니다.

Discovery 뉴스

자세히 보기

Discovery 뉴스는 Discovery에 포함되어 있으며 지속적으로 업데이트되는 뉴스 기사의 사전 강화된 데이터 세트입니다.

지식 그래프(베타)

자세히 보기

지식 그래프는 회사에서 "지식 허브"의 기능을 수행할 수 있으며 엔터프라이즈 검색, 요약, 추천 엔진 및 기타 의사결정 프로세스에 사용할 수 있습니다. 지식 그래프는 엔티티 및 관계를 추출하고 모호성을 제거하며, 알고리즘 기술을 통해 관계를 강화하고, 관련성 알고리즘을 통해 결과의 순위를 지정하여 비정형 데이터에서 사용자 정의된 지식 그래프를 자동으로 작성합니다.

요소 분류

자세히 보기

요소 분류를 사용하면 관리하는 문서를 통해 빠르게 구문 분석하여 중요한 요소를 전환, 식별 및 분류할 수 있습니다. 최첨단 자연어 처리를 통해 문서 요소에서 당사자(참조하는 사용자), 종류(요소 유형) 및 카테고리(특정 클래스)를 추출합니다.

문서 중복 제거(베타)

자세히 보기

Discovery 뉴스 컬렉션을 조회하는 경우 또는 개인용 데이터 컬렉션에 여러 개의 동일한(또는 거의 동일한) 문서가 포함되어 있는 경우 문서 중복 제거를 사용하여 조회 결과에서 동일한 문서를 제외할 수 있습니다.

시각적 인사이트(실험적 기능)

자세히 보기

시각적 인사이트는 Discovery가 시맨틱 요소, 관계, 개념 등에 대한 이해를 기반으로 파악한 연결을 시각적으로 탐색하는 데 사용할 수 있는 실험적 기능입니다. 이 기능을 사용하면 Discovery를 사용하기 전에 자신의 컬렉션에 대해 자세히 알아볼 수 있습니다. 조회를 작성하고 새로운 애플리케이션이나 기존 솔루션에 통합하여 사용자가 필요로 하는 정보를 제공할 수 있습니다.

문서 세그먼트화

자세히 보기

Word, PDF, HTML 문서를 HTML 표제 태그를 기반으로 한 세그먼트로 분할할 수 있습니다. 분할하면 각 세그먼트가 개별적으로 강화되고 색인화된 개별 문서가 됩니다. 조회에서 이러한 세그먼트를 개별 문서로 리턴하기 때문에 문서 세그먼트화를 사용하여 문서의 개별 세그먼트에 대한 집계를 수행하고 문서가 아닌 세그먼트 단위에서 관련성 훈련을 수행하여 결과 순위 재지정의 정확성을 향상시킬 수 있습니다.

조회 확장

자세히 보기

Discovery API를 통해 조회 확장 용어 목록을 업로드하여 조회 범위를 정확한 일치 이상으로 확장할 수 있습니다. 예를 들어, "car"에 대한 조회에 "automobile" 및 "motor vehicle"을 포함하도록 확장할 수 있습니다. 조회 확장 용어에는 보통 일반적인 용어에 대한 동의어, 반의어 또는 대표적인 맞춤법 오류가 포함됩니다.