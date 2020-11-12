자연어 처리(NLP), 자연어 이해(NLU), 자연어 생성(NLG)은 모두 관련이 있지만 별개의 주제입니다. 크게 보면 NLU와 NLG는 NLP의 구성 요소일 뿐입니다. 이 세 가지는 교차하므로 일반적으로 대화에서 혼동되지만, 이 게시물에서는 각 용어를 개별적으로 정의하고 차이점을 요약하여 모호한 부분을 명확히 하겠습니다.
컴퓨터 언어학에서 발전한 자연어 처리는 컴퓨터 과학, 인공 지능, 언어학 및 데이터 과학과 같은 다양한 분야의 방법을 사용하여 컴퓨터가 문어체와 구어체 형태로 인간의 언어를 이해할 수 있도록 합니다. 컴퓨팅 언어학은 언어 측면에 더 중점을 두는 반면, 자연어 처리는 언어 번역이나 질문 답변과 같은 작업을 완료하기 위해 머신 러닝 및 딥 러닝 기술을 사용하는 데 초점을 맞춥니다. 자연어 처리는 비정형 데이터를 가져와 구조화된 데이터 형식으로 변환하는 방식으로 작동합니다. 이는 단어의 어근을 조사하는 토큰화, 형태소 분석, 표제어 추출과 같은 방법을 사용하여 명명된 엔티티를 식별(Named Entity Recognition이라는 프로세스)하고 단어 패턴을 식별함으로써 수행됩니다. 예를 들어, 'called'와 같은 단어의 접미사 '-ed'는 과거 시제를 나타내지만, 현재 시제 동사 'calling'과 동일한 기본 부정사(to call)를 갖습니다.
많은 NLP 알고리즘이 존재하지만, 다양한 유형의 언어 작업에 대해 다양한 접근 방식이 활용되는 경향이 있습니다. 예를 들어, 은닉 마르코프 체인은 대체적으로 품사 태그 지정에 사용됩니다. 순환 신경망은 적절한 텍스트 시퀀스를 생성하는 데 도움이 됩니다. 단순 언어 모델(LM)인 N-gram은 문장이나 문구에 확률을 할당하여 응답의 정확성을 예측합니다. 이러한 기술은 챗봇과 같은 널리 사용되는 기술이나 Amazon Alexa 또는 Apple Siri와 같은 음성 인식 제품을 지원하기 위해 함께 작동합니다. 그러나 그 적용 범위는 그보다 더 광범위하며, 교육 및 의료와 같은 다른 산업에도 영향을 미치고 있습니다.
자연어 이해는 텍스트와 음성의 구문 및 의미론적 분석을 사용하여 문장의 의미를 결정하는 자연어 처리의 하위 집합입니다. 구문은 문장의 문법 구조를 나타내고, 의미론은 의도된 의미를 암시합니다. NLU는 또한 단어와 구문 간의 관계를 지정하는 데이터 구조인 관련 온톨로지를 설정합니다. 인간은 대화 중 이를 자연스럽게 수행하지만, 기계가 다양한 텍스트의 의도된 의미를 이해하려면 이러한 분석의 조합이 필요합니다.
동철동음이의어와 동음이의어를 구별하는 인간의 능력은 언어의 뉘앙스를 잘 보여줍니다. 예를 들어 다음 두 문장을 살펴보겠습니다.
첫 번째 문장에서 'current'라는 단어는 명사입니다. 그 앞에 있는 동사인 'swimming'은 독자에게 추가적인 맥락을 제공하여 이 문장의 'current'가 바닷물의 흐름을 의미한다는 결론을 내릴 수 있게 합니다. 두 번째 문장에서는 'current'라는 단어가 형용사로 사용되었습니다. 이 문장의 'current'가 설명하는 명사인 'version'은 보고서의 여러 반복을 의미하므로, 여기의 'current'는 파일의 최신 상태를 의미한다는 사실을 파악할 수 있습니다.
이러한 접근 방식은 데이터 마이닝에서도 소비자의 태도를 이해하기 위해 널리 사용됩니다. 브랜드는 특히 감정 분석을 통해 고객 피드백을 보다 면밀히 모니터링하여 긍정적이거나 부정적인 소셜 미디어 댓글을 클러스터링하고 순 고객 추천 점수를 추적할 수 있습니다. 기업은 부정적인 감정이 내포된 댓글을 검토하여 제품이나 서비스에서 잠재적인 문제가 있는 영역을 보다 신속하게 식별하고 해결할 수 있습니다.
자연어 생성은 자연어 처리의 또 다른 하위 집합입니다. 자연어 이해는 컴퓨터 독해 능력에 중점을 두는 반면, 자연어 생성은 컴퓨터가 글을 쓸 수 있게 합니다. NLG는 일부 데이터 입력을 기반으로 인간의 언어 텍스트 응답을 생성하는 프로세스입니다. 이 텍스트는 Text to Speech 서비스를 통해 음성 형식으로 변환될 수도 있습니다.
NLG에는 정보의 무결성을 유지하면서 입력된 문서에서 요약을 생성하는 텍스트 요약 기능도 포함되어 있습니다. 추출 요약은 That's Debatable에서 사용되는 핵심 포인트 분석을 지원하는 AI 혁신입니다.
처음에 NLG 시스템은 템플릿을 사용하여 텍스트를 생성했습니다. 이때 NLG 시스템은 문장 완성 놀이에서 하는 것처럼 일부 데이터나 쿼리를 기반으로 빈칸을 채웠습니다. 그러나 시간이 지날수록 자연어 생성 시스템이 은닉 마르코프 체인, 순환 신경망과 트랜스포머의 적용으로 발전하면서 실시간으로 보다 동적인 텍스트 생성이 가능해졌습니다.
NLU와 마찬가지로 NLG 애플리케이션은 형태, 어휘, 구문 및 의미론을 기반으로 하는 언어 규칙을 고려하여 응답을 적절하게 표현하는 방법을 선택해야 합니다. 이러한 애플리케이션은 이 문제를 다음 세 단계로 해결합니다.
자연어 처리와 이의 하위 분야는 오늘날 의료 진단이나 온라인 고객 서비스 등 다양한 분야에서 실제로 사용됩니다.
IBM의 최신 연구를 살펴보거나 IBM의 제품 및 서비스 중 하나인 Watson Natural Language Understanding을 둘러보세요. Watson Natural Language Understanding의 텍스트 분석 서비스는 텍스트 데이터에서 카테고리, 개념, 엔티티, 키워드, 관계, 감정, 구문에 대한 인사이트를 도출 및 제공하여 사용자의 요구에 빠르고 효율적으로 대응할 수 있도록 지원합니다. 비즈니스가 AI를 위해 올바른 방향으로 대규모 데이터 분석 및 주입을 수행할 수 있도록 지원하세요.
IBM Granite는 비즈니스에 맞게 맞춤화되고 AI 애플리케이션 확장에 최적화되었으며 개방적이고 성능이 뛰어나며 신뢰할 수 있는 AI 모델 제품군입니다. 언어, 코드, 시계열 및 가드레일 옵션을 살펴보세요.
IBM은 2,000개 조직을 대상으로 AI 이니셔티브에 대한 설문조사를 실시하여 효과적인 전략과 효과적이지 못한 전략, 그리고 앞서나갈 수 있는 방법을 알아보았습니다.
IBM watsonx Orchestrate를 사용하여 확장 가능한 AI 어시스턴트 및 에이전트를 쉽게 설계하고, 반복적인 작업을 자동화하고, 복잡한 프로세스를 간소화합니다.
강력하고 유연한 라이브러리, 서비스 및 애플리케이션 포트폴리오로 인공 지능의 비즈니스 가치를 가속화합니다.
AI 추가를 통해 중요한 워크플로와 운영을 혁신함으로써 경험, 실시간 의사 결정 및 비즈니스 가치를 극대화합니다.
