Apache Lucene을 기반으로 구축되었으며 원래 또 다른 검색 및 분석 엔진인 Elasticsearch에서파생된 OpenSearch는 실시간 검색, 관측 가능성, 분석 및 보안 분석 사용 사례를 위한 확장 가능한 분산 아키텍처를 제공합니다.
OpenSearch에는 데이터 시각화 및 애플리케이션 모니터링을 위한 OpenSearch 대시보드가 포함되어 있습니다. 또한 최신 데이터 환경 전반에서 분석 워크플로를 지원하는 플러그인, 애플리케이션 프로그래밍 인터페이스(API) 및 클라이언트로 구성된 광범위한 에코시스템을 갖추고 있습니다.
커뮤니티 기반 로드맵이 포함된 오픈 소스 프로젝트로 개발되었기 때문에 조직은 라이선스 제한이나 공급업체 종속 없이 OpenSearch를 사용할 수 있습니다. 확장 가능한 플러그인 프레임워크와 함께 이전 버전의 Elasticsearch와의 호환성을 통해 팀은 운영 워크로드, 머신 러닝 파이프라인 및 애플리케이션을 위한 유연한 Flexible Analytics 엔진으로 OpenSearch를 채택할 수 있습니다.
Think 뉴스레터를 통해 AI, 자동화, 데이터 등 가장 중요하고 흥미로운 업계 동향에 대한 최신 소식을 받아보세요. IBM 개인정보 보호정책을 참조하세요.
오늘날 기업들은 엄청난 양의 데이터를 생성하는데, 이 데이터는 매우 귀중하지만, 색인화되고 검색 가능하며 실시간으로 이용 가능할 때만 그 가치를 제대로 발휘합니다. OpenSearch는 확장성, 비용 효율성 및 상호 운용성을 위해 설계된 오픈 소스 검색 아키텍처를 통해 이 기능을 제공합니다.
실제로 OpenSearch는 다음을 제공합니다.
기업은 OpenSearch의 코드베이스와 로드맵에 대한 완전한 가시성을 확보하여 내부 요구 사항에 맞게 플랫폼을 사용자 정의할 수 있습니다.
OpenSearch는 오픈 소스 Elasticsearch와 API 및 쿼리 구문 호환성을 유지합니다. 즉, 조직은 광범위한 재작성 없이 워크로드를 채택하거나 현대화할 수 있습니다.
OpenSearch는 로그, 지표 및 추적을 대규모로 수집하여 문제 해결 및 분석에 사용되는 운영 대시보드를 강화할 수 있습니다.
기본 제공되는 인증 및 액세스 제어를 통해 팀은 보안 워크로드 전반에 검색 기능을 적용할 수 있습니다.
오픈 소스 소프트웨어인 OpenSearch는 온프레미스, 클라우드 제공업체 또는 관리형 서비스 오퍼링을 통해 배포할 수 있습니다.
OpenSearch는 인기 있는 시각화 계층인 Elasticsearch 및 Kibana의 라이선스 변경에 대한 커뮤니티의 대응으로 시작되었습니다. Elasticsearch의 이전 버전은 Apache 2.0 라이선스에 따라 출시되었지만 이후 릴리스에서는 서버 측 공개 라이선스(SSPL)와 탄력적 라이선스를 채택했습니다. 이러한 라이선스는 오픈 소스 재사용을 제한하여 자유롭게 배포 및 재배포 가능한 검색 소프트웨어에 의존하는 조직에 어려움을 야기했습니다.
오픈 검색 에코시스템을 보존하기 위해 Amazon Web Services(AWS)는 Elasticsearch와 Kibana의 최신 Apache 2.0 버전을 포크하여(즉, 독립적인 복사본을 생성) OpenSearch 프로젝트를 만들었습니다. 이 프로젝트는 개방형 거버넌스 모델에 따라 새로운 기능과 개선 사항을 도입했으며, Elasticsearch API 및 클라이언트 라이브러리와의 호환성을 확장하여 마이그레이션을 간소화했습니다.
그 이후로 OpenSearch 프로젝트는 독립적으로 발전해 왔습니다. 커뮤니티 중심의 로드맵, 여러 제공업체의 기여, GitHub에서 호스팅되는 플러그인 에코시스템의 성장 등을 특징으로 합니다. OpenSearch는 기존의 많은 Elasticsearch 패턴과 호환성을 유지하면서 벡터 검색, 이상 탐지 및 관측 가능성 도구를 위한 플러그인을 추가하여 기능을 확장했습니다.
두 프로젝트 모두 공통된 기원을 공유하지만, 그 길은 서로 달랐습니다. Elasticsearch는 독점적인 기능 개발 전략을 통해 SSPL 및 Elastic 라이선스에 따라 계속 운영됩니다. 반면 OpenSearch는 Apache 2.0 라이선스를 유지하며 개방성, 확장성 및 운영 가시성을 우선시합니다. 그 결과, 조직은 이제 기능뿐만 아니라 거버넌스 모델, 라이선스 조건 및 장기적인 에코시스템 방향까지 평가하게 됩니다.
호환성은 계속해서 프로젝트 간의 중요한 가교 역할을 합니다. OpenSearch는 여전히 이전 버전의 많은 Elasticsearch API, 쿼리 패턴 및 클라이언트 라이브러리를 지원하므로 팀이 최소한의 리팩토링으로 마이그레이션할 수 있습니다. 또한 유사한 리포지토리 구조와 인덱스 형식을 유지하여 Elasticsearch에서 전환하는 사용자에게 친숙함을 유지합니다.
OpenSearch는 확장성과 실시간 성능을 위해 설계된 분산 아키텍처를 기반으로 합니다. 핵심 구성 요소에는 클러스터, 노드, 인덱스, 샤드 및 문서가 포함되며 모두 함께 작동하여 데이터를 효율적으로 저장하고 검색합니다.
노드는 인덱싱, 쿼리 및 스토리지 작업을 수행하는 서버 또는 컨테이너화된 인스턴스입니다. 일반적인 노드 유형에는 다음이 포함됩니다.
인덱스는 관계형 데이터베이스 테이블과 유사한 논리적 네임스페이스입니다. 여기에는 JSON 문서의 구조를 정의하는 매핑과 해당 문서를 저장하는 샤드에 대한 참조가 포함되어 있습니다. '인덱스'라는 용어는 데이터로 인덱스를 채우는 행위를 설명하는 동사로도 사용됩니다.
문서는 개별 레코드를 나타내는 JSON 객체입니다. 간단히 말해, 데이터를 저장하고 검색하는 것입니다. 인덱싱되면 각 문서 내의 필드가 분석, 토큰화 및 반전 인덱스에 저장됩니다.
샤드는 문서가 보관되는 OpenSearch의 기본 저장 단위입니다. 각 인덱스는 기본 샤드와 선택적 복제 샤드로 구성됩니다.
각 샤드는 독립형 Lucene 인스턴스(독립형 검색 엔진 라이브러리)이기 때문에 OpenSearch는 노드에 샤드를 배포하여 검색 작업을 병렬화하고 성능을 확장합니다.
그렇다면 이 모든 것이 어떻게 결합될까요? 문서가 인덱싱되면 OpenSearch는 콘텐츠를 분석하고 텍스트 분석기와 토크나이저를 적용합니다. 처리 후에는 해당 용어를 적절한 샤드에 기록합니다.
인덱싱은 데이터 노드에서 처리되며 속도와 안정성을 위해 클러스터 전체에 분산될 수 있습니다. 그런 다음 쿼리가 조정 노드에 제출되면 조정 노드는 관련 데이터가 포함된 샤드를 식별하고 쿼리를 해당 샤드에 전달하고 결과를 집계합니다.
다양한 스테이션이 있는 레스토랑 주방이라고 생각하면 됩니다. 인덱싱은 주문이 들어올 때 바로 준비할 수 있도록 재료를 준비하여 올바른 스테이션으로 보내는 것과 같습니다. 쿼리가 도착하면 조정 노드는 필요한 것을 호출하고 각 방송국의 기여도를 수집하여 완성된 접시 하나를 전달하는 익스페디터처럼 작동합니다.
OpenSearch에는 검색, 분석 및 관측 가능성 기능을 위한 내장 기능이 포함되어 있습니다. 플러그인과 확장 기능으로 기능이 확장되어 팀에서 특수한 워크로드에 맞게 플랫폼을 조정할 수 있습니다.
다음은 모든 기능을 나열한 것은 아니지만, 분석, 머신 러닝(ML) 및 관측 가능성 시나리오를 지원하는 인기 있는 확장 기능입니다.
관리형 환경을 선호하는 조직은 AWS의 OpenSearch 클러스터에 대한 확장, 백업, 노드 교체 및 유지 관리를 자동화하는 Amazon OpenSearch Service를 사용할 수도 있습니다.
OpenSearch 대시보드는 OpenSearch를 위한 시각화 및 분석 인터페이스입니다. 인덱싱된 데이터를 탐색하고, 시각화를 구축하고, 관측 가능성, 보안 분석 및 애플리케이션 모니터링 워크플로 전반에 걸쳐 사용되는 운영 대시보드를 만들기 위한 대화형 환경을 제공합니다. 예를 들어 팀은 대시보드를 활용하여 지표의 추세를 시각화하고 거의 실시간으로 이상 현상을 조사할 수 있습니다.
OpenSearch 대시보드는 차트, 표, 지도, 노트북 및 사용자 정의 패널 생성을 지원합니다. 또한 분석을 간소화하도록 설계된 기능도 포함되어 있습니다. 노트북을 사용하면 사용자는 시각화와 텍스트를 결합하여 하나의 내러티브를 만들 수 있으며, 운영 패널은 파이프라인 처리 언어로 생성된 관측 가능성 시각화를 통합된 디스플레이로 구성합니다.
OpenSearch 대시보드는 Kibana와 사용자 인터페이스(UI)의 유산을 공유하기 때문에 많은 데이터 팀에서 워크플로가 익숙하다고 느낍니다. 하지만 자체 로드맵에 따라 개발되었으며 광범위한 OpenSearch 기능 세트를 반영하는 기능을 포함합니다.
OpenSearch는 다음을 포함하여 산업 전반에 걸쳐 광범위한 사용 사례를 지원합니다.
지표, 로그 및 추적을 지원하는 OpenSearch는 통합 관측 가능성 플랫폼을 제공합니다. Trace Analytics는 서비스 상호 작용을 시각화하고, 애플리케이션 분석은 원격 측정의 상관 관계를 파악하여 시스템 동작을 이해하고 지연 시간 또는 장애를 정확히 찾아냅니다. 대시보드와 PPL 쿼리를 통해 팀은 문제를 신속하게 조사하고 재사용 가능한 운영 뷰를 만들 수 있습니다.
OpenSearch의 이상 탐지 및 ML Commons 알고리즘을 통해 조직은 보안 운영 전반에 검색 및 분석 기술을 적용할 수 있습니다. 팀은 이를 사용하여 인증 로그 또는 애플리케이션 동작에서 비정상적인 패턴을 감지하고 조건이나 임계값이 충족되면 알림을 트리거합니다.
조직은 웹사이트, 제품 카탈로그 및 엔터프라이즈 콘텐츠 시스템의 기반이 되는 검색 엔진으로 OpenSearch를 사용합니다. 전체 텍스트 검색, 자동 완성, 구문 일치 및 벡터 검색은 다양한 사용자 경험 및 추천 사용 사례를 지원합니다.
OpenSearch 대시보드는 팀이 데이터를 탐색하고, 추세를 모니터링하고, KPI를 추적하고, 이해관계자와 통찰력을 공유하는 데 도움이 되는 대화형 시각화, 보고 및 노트북을 제공합니다.
재플랫폼이나 종속 없이, 거버넌스가 적용된 연결된 데이터를 기반으로 하는 컨텍스트 인식 AI 에이전트를 통해 신뢰할 수 있는 답변을 얻을 수 있습니다.
탁월한 고객 및 직원 경험을 제공하기 위해 데이터 사일로를 제거하고, 복잡성을 줄이며, 데이터 품질을 개선해 주는 데이터 전략을 구축하세요.
적합한 전략, 데이터, 보안과 거버넌스를 마련하여 AI를 성공적으로 확장하세요.