자연어 처리(NLP)는 컴퓨터에게 인간과 매우 유사한 방식으로 텍스트 및 음성 언어를 이해하는 능력을 부여하는 것과 관련된 컴퓨터 공학의 한 분야, 더 구체적으로 말하자면 인공지능(AI)의 한 분야입니다.
NLP는 인간 언어를 규칙 기반으로 모델링하는 전산언어학과 통계적 머신 러닝 및 딥 러닝 모델을 결합합니다. 이러한 기술들은 컴퓨터가 텍스트 또는 음성 데이터의 형태로 인간의 언어를 처리하고, 발화자 또는 작성자의 의도와 감정을 포함한 완전한 의미를 '이해'할 수 있도록 합니다.
NLP는 신속하게 그리고 심지어 실시간으로 텍스트를 한 언어에서 다른 언어로 번역하고, 음성 명령에 응답하며, 대량의 텍스트를 요약하는 컴퓨터 프로그램을 지원합니다. 여러분은 음성 작동 GPS 시스템, 디지털 상담원, 음성-텍스트 받아쓰기 소프트웨어, 고객 서비스 챗봇 및 기타 소비자를 위한 편의 시스템의 형태로 NLP와 상호작용을 해보셨을 겁니다. 그러나 NLP는 비즈니스 운영을 효율화하고, 직원 생산성을 높이고, 미션 크리티컬 비즈니스 프로세스를 간소화하도록 돕는 엔터프라이즈 솔루션에서도 점점 더 큰 역할을 수행하고 있습니다.
파운데이션 및 머신 러닝 모델을 쉽게 훈련 및 검증하고 조정 및 배치하세요.
인간의 언어는 모호함으로 가득 차 있기 때문에 텍스트 또는 음성 데이터의 의도된 의미를 정확하게 파악하는 소프트웨어를 작성하기가 매우 어렵습니다. 동철이의어, 동음이의어, 풍자, 관용어구, 은유, 문법 및 용법의 예외, 문장 구조의 변화 등은 인간 언어의 불규칙성을 보여주는 몇 가지 예에 불과합니다. 인간이 이러한 불규칙성을 학습하려면 수 년이 소요됩니다. 그러나 프로그래머가 유용한 애플리케이션을 만들려면 자연어 기반 애플리케이션이 처음부터 정확하게 인식하고 이해하도록 가르쳐야 합니다.
여러 NLP 작업에서 컴퓨터가 수집하는 데이터를 이해하기 쉽도록 인간의 텍스트 및 음성 데이터를 분석합니다. 이러한 작업의 예는 다음과 같습니다.
블로그 게시물 “NLP, NLU 및 NLG 비교: 세 가지 자연어 처리 개념 간의 차이점”을 읽고 이 개념들이 서로 어떤 관련이 있는지 자세히 알아보세요.
Python 프로그래밍 언어는 특정 NLP 작업을 공략하기 위한 다양한 툴과 라이브러리를 제공합니다. 이들 중 다수는 자연어 툴키트(NLTK)에서 찾을 수 있습니다. NLTK는 NLP 프로그램 구축을 위한 라이브러리, 프로그램, 교육 리소스로 구성된 오픈 소스 컬렉션입니다.
NLTK는 위에 나열된 NLP 작업 중 다수를 위한 라이브러리와 더불어 문장 구문 분석(sentence parsing), 단어 분할(word segmentation), 어간 추출(stemming) 및 표제어 추출(lemmatization)(단어를 어근까지 쪼개는 방법) 및 토큰화(구문, 문장, 단락 및 지문을 컴퓨터가 텍스트를 더 잘 이해하도록 돕는 토큰으로 분해하는 것)와 같은 하위 작업을 위한 라이브러리도 포함합니다. 또한 의미론적 추론과 같은 기능을 구현하기 위한 라이브러리도 포함됩니다. 의미론적 추론은 텍스트에서 추출한 사실을 기반으로 논리적 결론에 도달하는 것입니다.
초기 NLP 애플리케이션은 특정 NLP 작업을 수행할 수 있지만, 끝이 없어 보이는 예외들이나 증가하는 양의 텍스트 및 음성 데이터를 쉽게 처리하지 못하는, 수작업으로 코딩된 규칙 기반 시스템이었습니다.
컴퓨터 알고리즘을 머신 러닝 및 딥 러닝 모델과 결합하여 자동으로 텍스트 및 음성 데이터의 요소들을 추출, 분류, 레이블링한 다음 이러한 요소들의 가능한 의미 각각에 대해 통계적 가능성을 할당하는 통계적 NLP로 들어가 보십시오. 현재 컨볼루션 신경망(convolutional neural network, CNN)과 순환 신경망(recurrent neural network, RNN) 기반의 딥 러닝 모델과 학습 기법을 통해 대량의 가공되지 않고 레이블링되지 않은 비정형 텍스트 및 음성 데이터 세트로 작업하면서 훨씬 더 정확한 의미를 추출하는 과정에서 '학습'하는 NLP 시스템을 활성화합니다.
이러한 기술들 간의 미묘한 차이와 이러한 학습 접근 방식에 대해 자세히 알아보려면 “AI, 머신 러닝, 딥 러닝 및 신경망: 차이점”을 확인하세요.
자연어 처리는 실제 여러 최신 애플리케이션에서 기계의 지능을 높이는 원동력입니다. 몇 가지 예는 아래와 같습니다.
AI 기반 엔터프라이즈 검색 기술을 사용하여 비즈니스 데이터에서 중요한 응답 및 인사이트를 찾습니다.
고급 텍스트 분석을 위한 자연어 처리(NLP) 서비스입니다.
어느 채널을 통해서든 첫 번째 시도에서 고객의 문제를 해결합니다.
이 설명서를 통해 다양한 NLP 적용사례에 대해 알아보세요.
자연어 처리를 통해 컴퓨터와 더 자연스럽게 대화할 수 있도록 지원하는 방법을 알아봅니다.
IBM은 누구나 웹에서 간편하고 쉽게 정보를 찾을 수 있도록, 다언어 질문-답변 시스템의 진전에 박차를 가하는 새로운 오픈 소스 툴키트인 PrimeQA를 출시했습니다.
IBM Watson NLP 서비스를 활용하여 더욱 스마트한 애플리케이션을 개발합니다.