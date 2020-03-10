머신 러닝 기반 자연어 처리(NLP) 모델의 도움으로 비즈니스는 프로세스 속도를 높이고, 더 정확한 예측을 수행하며, 기존 데이터에서 새로운 인사이트를 발견할 수 있습니다. 노력의 가치를 극대화하려면 특정 사용 사례에 적합한 머신 러닝 기반 NLP 서비스를 선택하는 것이 중요합니다. IBM에서는 "머신 러닝 모델이 내 데이터를 읽는 방법을 어떻게 알 수 있나요?" 또는 "머신 러닝 모델이 무엇을 찾아야 하는지 어떻게 알 수 있나요?"와 같은 질문을 자주 받습니다. 답은 사용하는 모델에 따라 다릅니다.
NLP를 사용하여 머신 러닝 솔루션을 구축하는 두 가지 접근 방식, 즉 즉시 사용 가능한 모델과 사용자 지정 모델에 대해 살펴보겠습니다. 일반적인 인사이트를 빠르게 발견해야 하는 경우, 즉시 사용 가능한 모델이 필요할 수 있습니다. 사용 사례에 특정 산업 또는 도메인 데이터(예: 전문 데이터 또는 전문 용어)가 포함된 경우 사용자 지정 모델이 적합합니다.
텍스트 기반 분석을 위한 솔루션을 구축하는 것이 번거롭고 시간이 많이 걸린다는 이야기를 자주 듣습니다. 문서를 분류하고, 텍스트에서 키워드나 감정에 레이블을 지정하는 데 몇 시간을 소비하는 것은 시간을 가장 잘 활용하는 방법이 아닙니다. 즉시 사용 가능하거나 사전 학습된 NLP 모델이 이러한 작업을 자동화합니다. 기본 제공 모델은 시간이 제한되어 있거나 학습할 데이터가 없는 경우 엄청난 이점을 제공합니다. 빠른 개념 증명에 효과적이며 특히 문서 내에서 카테고리나 개념과 같은 상위 수준의 항목을 이해해야 할 때 ROI가 높습니다. 사전 구축된 모델은 범용 데이터 소스를 기반으로 학습되는 경우가 많으며 특정 산업이나 도메인에 맞게 조정되지 않는 경향이 있습니다.
사용 사례에 특정 산업 용어가 포함되어 있는 경우 사전 학습된 모델은 요구 사항의 일부만 충족할 수 있습니다. 업계마다 사람, 장소, 이벤트 등 일부 엔티티의 의미가 다르기 때문에 즉시 사용 가능한 모델은 상황에 따라 이러한 뉘앙스를 포착하지 못할 수 있습니다. 예를 들어, "프리미엄"이라는 단어는 제품군의 최고급을 의미할 수도 있고, 보험 증권에 대한 대가로 지불하는 금액을 의미할 수도 있습니다. 호주에서는 이 보험금을 "커버"라고 합니다.
사용자 지정 모델은 사용 사례 및 산업 도메인과 관련된 근본적인 뉘앙스, 의미 및 관계를 이해하도록 학습시킬 수 있습니다. 위와 같이 비즈니스의 맥락에서 "프리미엄"이라는 단어의 의미를 모델에게 가르칠 수 있습니다. 이러한 모델은 몇 가지 방법으로 구축할 수 있으며 데이터 과학자가 아니어도 모델을 만들 수 있습니다. 코드가 필요 없는 도구를 사용하면 주제에 대한 전문 지식만 있으면 됩니다. 주제별 전문가(SME)가 모델에서 중요한 정보를 정의하고, 교육용 문서를 업로드한 다음, 해당 문서 내에서 주석이라고 하는 예시를 선택합니다.
문서에 작성하는 표기법은 모델에 대한 "근거 자료" 역할을 하는 구체적인 예시를 시스템에 제공합니다. 문서에서 추출할 특정 엔티티를 정의하든, 엔티티 간의 관계를 정의하든, 학습을 통해 모델의 효율성을 보장하는 개선 작업을 수행할 수 있습니다.
즉시 사용 가능한 NLP 모델과 맞춤형 NLP 모델을 결합하면 두 가지 장점을 모두 누릴 수 있습니다. 먼저 위치나 조직과 같은 간단한 구성 요소를 이해하도록 모델을 학습시키는 것이 좋습니다. 이렇게 하면 NLP 모델이 비즈니스에 중요한 부분을 반영하여 궁극적으로 더 현명한 결정을 내릴 수 있습니다.
기본 제공 NLP 모델과 맞춤형 NLP 모델의 차이점에 대해 자세히 알아보거나, Watson Natural Language Understanding과 Watson Discovery를 사용하여 나만의 고유한 머신 러닝 기반 NLP 모델을 구축해 보세요.
