업계 뉴스레터
전문가가 전하는 최신 AI 트렌드
가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.
구독은 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
자연어 생성(NLG)은 인공 지능(AI)을 사용하여 정형 및 비정형 데이터에서 아웃풋을 생성하는 것입니다. NLG를 사용하면 컴퓨터 및 생성형 AI(gen AI) 소프트웨어 애플리케이션이 이해할 수 있는 인간 언어로 사용자와 상호 작용할 수 있습니다. NLG는 NLU(natural language understanding)와 함께 NLP(natural language processing)의 하위 범주입니다.
NLG 시스템은 비즈니스 인텔리전스(BI) 도구 및 챗봇과 같은 기업용 및 소비자용 제품 모두에서 이미 널리 사용되고 있습니다. 음성 어시스턴트는 NLG를 통해 사용자와 소통합니다.
비즈니스 리더는 NLG를 사용하여 복잡한 데이터를 생성된 텍스트로 변환하여 핵심 인사이트를 추출합니다. AI 모델이 인간 언어로 아웃풋을 생성할 때마다 NLG가 작동합니다.
업계 뉴스레터
가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.
구독은 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
NLG의 두 가지 주요 유형은 추출형과 추상형입니다.
추출적 NLG는 소스 텍스트에서 직접 정확한 단어와 구문을 가져옵니다. 이 NLG는 법률 문서와 같이 구체적인 표현이 중요한 경우에 사용됩니다. 추출적 NLG는 새로운 콘텐츠를 결과로 도출하는 것이 아니라 소스 문서에서 복사하므로, 추상적 NLG에 비해 더 간단합니다.
추상적 NLG는 소스 문서를 기반으로 새로운 아웃풋을 생성하고 새로운 콘텐츠를 의역하고 생성합니다. 변압기와 같은 고급 모델이 필요한 더 복잡한 프로세스입니다. 추출적 NLG가 기술 환경에서 선호되는 경우 추상적 NLG는 보다 창의적인 애플리케이션에서 빛을 발합니다.
NLG는 정형 및 비정형 데이터 입력을 개선하고 자연어 아웃풋을 생성하기 위해 다단계 프로세스를 진행합니다. 컴퓨터 과학자 Ehud Reiter가 설명한 것처럼1 일반적인 NLG 프로세스의 단계는 다음과 같습니다.
신호 분석: NLG 시스템이 최종 아웃풋에 필요한 입력 데이터를 파악합니다. 신호 분석 또는 데이터 분석 단계에서는 패턴 인식을 통해 콘텐츠의 주제와 주제 간 관계를 파악합니다. 입력 데이터에는 사용자 프롬프트, 데이터베이스 콘텐츠, PDF, 문서 및 음성 녹음과 같은 비정형 언어 콘텐츠가 포함됩니다. 엔티티 인식은 NLP 시스템이 논의 중인 내용을 이해하는 데 도움이 됩니다.
데이터 해석: NLP 모델은 데이터 분석 단계의 결과에서 인사이트를 생성합니다. 사용 가능한 인사이트로 데이터가 이미 사전 처리된 경우 이 단계는 건너뜁니다. NLP 시스템은 품사를 식별하고 NLU를 사용하여 구문과 의미를 평가하여 의미를 이해합니다.
문서 계획: 이 단계에서는 전달할 정보와 형식을 지정하는 방법을 파악합니다. NLG 시스템은 사용 가능한 데이터와 사용자 프롬프트에 따라 최종 아웃풋에 대한 접근 방식을 결정합니다.
미시적 계획: 커뮤니케이션의 내용과 형식을 결정한 후 NLG 시스템은 최종 아웃풋을 위한 문장과 단락 구조를 계획합니다.
표면 실현: NLG 시스템은 계획을 실행에 옮기고 이전 단계의 결과에 따라 자연어 아웃풋을 생성합니다.
NLG는 자연어 처리(NLP)의 컴퓨터 과학 분야에 속하며, 머신 러닝(ML) 모델을 사용하여 인간의 언어를 이해하고 작업하는 것입니다.
NLG는 NLP의 일부로서, 콘텐츠 생성, 특히 새로운 문어 또는 구어를 아웃풋하는 것과 관련됩니다. 예를 들어, 대화형 AI 챗봇은 NLG를 사용하여 실시간으로 사용자 입력에 응답합니다.
NLP는 자연어 입력을 데이터로 변환하고, NLG는 데이터를 사용하여 아웃풋을 생성합니다.
NLP는 컴퓨터가 인간의 언어를 분석하고 이해하는 방법을 연구하는 컴퓨팅 언어학 분야의 일부입니다. NLP는 실제로 컴퓨팅 언어학입니다.
딥 러닝과 대규모 언어 모델(LLM)의 개발로 NLP의 발전은 콘텐츠 제작을 처리하는 많은 생성형 AI 애플리케이션을 구동할 수 있게 했습니다.
NLU(Natural language understanding)는 NLP의 또 다른 하위 집합입니다. NLU는 문법적, 언어적 의미에 초점을 맞추기보다는 인간의 언어를 총체적으로 이해하려고 합니다. NLU는 의미론적 및 구문론적 분석을 사용하여 감정, 감성, 의도를 포함한 자연어 입력을 완전하고 상황에 맞게 이해합니다.
NLU를 통해 컴퓨터는 인간의 방식에 더 가까운 방식으로 자연어 입력을 이해할 수 있습니다. 사람들은 서로 대화할 때 사용되는 단어의 정의 이상의 과정을 처리합니다. 자연스럽게 화자의 문자 그대로의 단어 뒤에 숨겨진 더 깊은 의미를 이해할 수 있습니다.
소프트웨어 애플리케이션이 예측 텍스트 옵션을 제공하는 경우 NLU를 사용하여 사용자의 의도를 파악한 다음 NLG를 적용하여 문장을 완성합니다.NLP, NLU, NLG는 함께 작동하여 컴퓨터가 사용자와 소통하는 데 도움을 줍니다.
많은 NLG 시스템은 AI 모델을 사용하여 훈련 데이터와 사용자 입력을 바탕으로 새로운 텍스트를 생성합니다.
하지만 이러한 모델이 개발되기 전에는 다른 수단을 통해 NLG가 구현되었습니다. NLG 모델 및 기술은 다음을 포함합니다.
템플릿
규칙 기반 시스템
통계적 머신 러닝 알고리즘
딥 러닝 모델
트랜스포머
템플릿 기반 시스템은 입력 데이터에 변수와 함께 미리 정의된 문장 템플릿을 사용합니다. 템플릿은 가장 초기의 가장 단순한 NLG 유형 중 하나로, 문장과 문서 구조가 일관된 상황에 적합합니다. 그러나 템플릿 기반 시스템은 사전 정의된 사용 사례 외에는 적용할 수 없습니다.
템플릿의 예로는 [month],[year]에서 [location] 매장에서 [item]의 [amount] 단위를 판매했습니다.
이 템플릿은 위치 기반 매출을 보고하는 데 뛰어나지만, 요리 레시피를 생성하는 데는 적용할 수 없습니다.
규칙 기반 시스템은 일련의 사전 정의된 규칙과 논리에 따라 텍스트를 생성합니다. 초기의 규칙 기반 시스템은 도메인 전문가의 말이나 글쓰기 방식을 반영하기 위해 만들어졌습니다. 프로그래머는 전문가를 인터뷰한 다음 텍스트 생성을 위한 해당 규칙을 만들었습니다.
“If-then” 시스템은 규칙 기반 프로그래밍의 일반적인 예입니다. 예를 들어, 날씨 예보를 위한 NLG 소프트웨어는 기온이 화씨 32도 또는 섭씨 0도 이하인 경우 날씨를 "영하"로 설명하도록 지시할 수 있습니다.
딥 러닝 모델은 통계 알고리즘에 비해 AI 기술의 발전으로, 더 자연스러운 텍스트를 생성할 수 있습니다. 순환 신경망(RNN)은 NLG에 적용된 딥 러닝 모델의 예입니다.
RNN은 문장의 단어와 같은 순차적 데이터를 처리하고 기계 번역의 경우와 같이 지식을 전달할 수 있습니다.
NLG는 생성형 AI 환경 전체에 걸쳐 AI가 자연어로 인간과 직접 소통하는 데 사용되는 모든 곳에서 발견됩니다. Siri에서 감정 분석에 이르기까지, NLG 사용 사례는 다음과 같습니다.
음성 어시스턴트: Siri, Alexa 및 기타 음성 어시스턴트는 NLG를 사용하여 음성 언어로 사용자 요청에 응답합니다. 또한 음성 인식에 NLP 및 NLU를 사용하여 사용자가 원하는 것을 이해합니다. .
가상 어시스턴트: 챗봇과 가상 어시스턴트는 NLG를 사용하여 고객 상호작용을 자동화합니다. 많은 조직이 초기 고객 서비스 문의를 처리하고 필요한 경우 담당자에게 전달하기 전에 가상 어시스턴트를 활용합니다.가상 에이전트는 NLG를 통해 사용자와 소통하기도 합니다.
기계 번역: 기계 번역은 머신 러닝 모델을 사용하여 언어 간 자동 번역을 수행하는 것입니다. NLG(자연어 처리) 시스템이 아웃풋 생성을 처리하고 시간이 많이 소요되는 번역 프로세스를 간소화합니다. 이후 인간 번역가와 현지화 전문가가 필요에 따라 아웃풋을 검증하고 편집할 수 있습니다.
데이터 요약 및 보고: NLG 시스템은 복잡한 데이터를 이해하기 쉬운 요약 및 개요로 변환합니다. 문서와 보고서의 집계 및 요약을 간소화하면 예측 효율성이 향상됩니다. 기업 리더들은 데이터 기반 의사 결정을 위해 NLG 기반 BI 도구를 사용합니다. AI와 NLG를 활용하여 고객을 위한 콘텐츠를 제작하는 기업들도 있습니다.
콘텐츠 생성: 생성형 AI 모델이 자연어 콘텐츠를 아웃풋할 때마다 NLG가 수반됩니다. 기업은 NLG를 사용하여 제품 설명, 이메일 마케팅 캠페인, 소셜 미디어 게시물 및 기타 유형의 짧은 콘텐츠를 자동화할 수 있습니다.
감정 분석: NLG 시스템은 청중의 피드백과 커뮤니케이션을 기반으로 텍스트 요약과 보고서를 생성합니다. 기업은 제품 후기, 소셜 미디어 플랫폼, 포럼 게시물 및 기타 온라인 위치에서 사용자 생성 콘텐츠를 가져온 다음 NLP 및 NLG를 사용하여 사용자의 감정을 파악할 수 있습니다.
IBM watsonx Orchestrate를 사용하여 확장 가능한 AI 어시스턴트 및 에이전트를 쉽게 설계하고, 반복적인 작업을 자동화하고, 복잡한 프로세스를 간소화합니다.
강력하고 유연한 라이브러리, 서비스 및 애플리케이션 포트폴리오로 인공 지능의 비즈니스 가치를 가속화합니다.
AI 추가를 통해 중요한 워크플로와 운영을 혁신함으로써 경험, 실시간 의사 결정 및 비즈니스 가치를 극대화합니다.
1 자연어 생성, Ehud Reiter, Springer, 2024년.