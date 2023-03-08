이름에서 알 수 있듯이 생성형 AI는 이미지, 음악, 음성, 코드, 동영상 또는 텍스트를 생성하는 동시에 기존 데이터를 해석하고 조작합니다. 생성형 AI는 새로운 개념이 아닙니다. 생성형 AI의 기반이 되는 머신 러닝 기술은 지난 10년 동안 발전해 왔습니다. 최신 접근 방식은 "트랜스포머"라고 불리는 신경망 아키텍처를 기반으로 합니다. 트랜스포머 아키텍처와 비지도 학습을 결합하여 여러 데이터 양식을 처리할 수 있는 기존 벤치마크를 능가하는 대규모 파운데이션 모델이 등장했습니다.

이러한 대형 모델은 보다 발전되고 복잡한 모델 개발을 위한 출발점 역할을 하기 때문에 파운데이션 모델이라고 합니다. 파운데이션 모델을 기반으로 구축하면 특정 사용 사례 또는 도메인에 맞게 조정된 보다 전문적이고 정교한 모델을 만들 수 있습니다. 짧은 프롬프트를 입력하면 시스템이 매개변수에 따라 전체 에세이 또는 복잡한 이미지를 생성하는 GPT-3, BERT, T5 또는 DALL-E와 같은 모델의 초기 사례는 어떤 것이 가능한지 보여줬습니다.

대규모 언어 모델(LLM)은 자연어 처리(NLP) 작업을 위해 대량의 텍스트 데이터로 명시적으로 학습되었으며, 일반적으로 1억 개 이상의 상당한 수의 매개변수를 포함합니다. 이를 통해 다양한 작업을 위한 자연어 텍스트 처리와 생성이 용이해집니다. 각 모델에는 강점과 약점이 있으며, 어떤 모델을 사용할지 선택하는 것은 특정 NLP 작업과 분석되는 데이터의 특성에 따라 달라집니다. 특정 작업에 사용할 올바른 LLM을 선택하려면 LLM에 대한 전문 지식이 필요합니다.

BERT는 문장 내 단어 간의 양방향 관계를 이해하도록 설계되었으며 주로 작업 분류, 질문 답변 및 명명된 개체 인식에 사용됩니다. 반면 GPT는 주로 언어 번역, 요약 및 콘텐츠 생성과 같은 텍스트 생성 작업에 사용되는 단방향 트랜스포머 기반 모델입니다. T5도 트랜스포머 기반 모델이지만 텍스트 대 텍스트 접근 방식을 사용하여 학습되고 언어 번역, 요약, 질문에 대한 답변 등 다양한 자연어 처리 작업에 맞게 미세 조정할 수 있다는 점에서 BERT 및 GPT와 다릅니다.