셀프 어텐션은 머신 러닝 모델에 사용되는 일종의 어텐션 메커니즘입니다. 이 메커니즘은 입력 시퀀스에서 토큰의 중요성을 평가하여 이들 간의 관계를 더 잘 이해하는 데 사용됩니다. 이는 자연어 처리(NLP) 작업에 필수적인 강력한 인공 지능 아키텍처인 트랜스포머 모델의 중요한 부분입니다. 트랜스포머 아키텍처는 대다수 최신 대규모 언어 모델(LLM)의 기반입니다.

셀프 어텐션 메커니즘은 연구자들이 제안한 모델 신경망 아키텍처인 트랜스포머를 통해 도입되었습니다. 제안된 아키텍처의 목표는 컨볼루션 신경망(CNN)과 순환 신경망(RNN)을 사용하는 기존 머신 러닝 모델의 문제를 해결하는 것이었습니다.1

기존의 순차적 모델은 트랜스포머 모델과 동일한 인코더-디코더 아키텍처를 따르지만 데이터를 단계별로 또는 시퀀스 간(seq2seq) 처리합니다. 이 함수는 병렬화를 어렵게 만드는데, 병렬화란 입력 시퀀스의 모든 부분에 걸쳐 어텐션 가중치를 동시에 계산하여 계산 시간을 줄이고 아웃풋 생성을 향상하는 기능입니다.



셀프 어텐션은 훈련 예제 내에서 병렬화를 가능하게 함으로써 LLM의 발전에 핵심적인 역할을 했습니다. 이 방법은 시퀀스 길이가 길수록 더 많은 메모리 제약 조건으로 인해 학습 예제 전반에 걸쳐 일괄 처리가 제한되기 때문에 유용합니다. 셀프 어텐션을 사용하면 LLM 학습 데이터를 배치로 분할하고 여러 GPU에서 동시에 처리할 수 있습니다.1 셀프 어텐션은 병렬로 처리되는 효율적인 일괄 처리를 통해 머신 러닝 모델을 학습하는 데 필요한 계산 능력을 줄입니다.

셀프 어텐션은 계산 부하를 효율적으로 분산시키는 데 기여할 뿐만 아니라, 어텐션 가중치를 동시에 처리할 수 있게 합니다. 이 기능을 통해 모델은 입력 시퀀스의 관련 부분에 집중하여 시퀀스 내 각 요소의 중요성을 동적으로 예측할 수 있습니다. 셀프 어텐션은 기계 번역, 감정 분석 및 요약과 같은 NLP 작업에 유용합니다.