업계 뉴스레터
전문가가 전하는 최신 AI 트렌드
가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.
구독은 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
전이 학습은 한 작업 또는 데이터 세트를 통해 얻은 지식을 사용하여 다른 관련 작업 및/또는 다른 데이터 세트에서 모델 성능을 개선하는 머신 러닝 기술입니다.1 다시 말해, 전이 학습은 한 환경에서 학습된 내용을 사용하여 다른 환경에서 일반화를 개선하는 것입니다.2
전이 학습은 데이터 과학의 회귀 문제를 해결하는 것부터 딥 러닝 모델을 훈련하는 것까지 다양한 용도로 사용됩니다. 실제로 심층 신경망을 만드는 데 필요한 대량의 데이터를 고려할 때 후자의 경우 특히 매력적입니다.
기존의 학습 프로세스는 사용 가능한 라벨이 지정된 데이터를 기반으로 각각의 새로운 작업에 대해 새로운 모델을 구축합니다. 이는 기존 머신 러닝 알고리즘이 훈련 데이터와 테스트 데이터가 동일한 주요 공간에서 온다고 가정하기 때문입니다. 따라서 데이터 분포가 변경되거나 학습된 모델이 새 데이터 세트에 적용되는 경우 사용자는 첫 번째 모델과 비슷한 작업을 시도하더라도 새로운 모델을 처음부터 다시 훈련해야 합니다(예: 영화 후기와 노래 후기의 감성 분석 분류기 비교). 그러나 전이 학습 알고리즘은 이미 훈련된 모델이나 네트워크를 시작점으로 사용합니다. 그런 다음 초기 소스 작업 또는 데이터(예: 영화 후기 분류)에서 얻은 해당 모델의 지식을 새롭지만 관련된 대상 작업 또는 데이터(예: 노래 후기 분류)에 적용합니다.3
업계 뉴스레터
가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.
구독은 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
물론 한 도메인에서 다른 도메인으로 지식을 이전한다고 해서 품질이 낮은 데이터의 부정적인 영향을 상쇄할 수는 없습니다. 데이터 증강 및 특징 추출과 같은 전처리 기술과 특징 엔지니어링은 전이 학습을 사용할 때 여전히 필요합니다.
전이 학습에 내재된 단점이 있는 경우보다는 잘못된 적용으로 인해 잠재적으로 부정적인 결과가 발생할 수 있는 경우가 더 많습니다. 전이 학습은 다음 세 가지 조건이 충족될 때 가장 효과적입니다.
이러한 조건이 충족되지 않으면 전이 학습이 모델 성능에 부정적인 영향을 미칠 수 있습니다. 문헌에서는 이를 부정적 전이이라고 합니다. 진행 중인 연구는 데이터 세트와 작업이 위의 조건을 충족하는지 여부를 결정하기 위한 다양한 테스트를 제안하기 때문에 부정적 전이가 발생하지 않습니다.5 원거리 전이는 소스 및 대상 데이터 세트의 데이터 분포가 너무 크게 달라서 발생하는 부정적 전이를 수정하기 위해 개발된 방법 중 하나입니다.6
전이 학습을 위한 작업 간의 유사성을 판단하는 널리 사용되는 표준 메트릭은 없습니다. 그러나 소수의 연구에서는 데이터 세트와 머신 러닝 작업 간의 유사성을 예측하는 다양한 평가 방법을 제안하여 전이 학습의 실행 가능성을 제시합니다.7
전이 학습에는 세 가지 비슷한 관행 또는 하위 설정이 있습니다. 서로 간의 구별뿐만 아니라, 보다 광범위하게 전이 학습은 주로 소스 도메인, 대상 도메인, 완료해야 할 작업 간의 관계 변화에서 비롯됩니다.8
전이 학습은 미세 조정과 다릅니다. 물론 두 가지 모두 새로운 모델을 학습시키는 것이 아니라 기존의 머신 러닝 모델을 재사용합니다. 그러나 유사점은 대체로 거기서 끝납니다. 미세 조정은 모델이 구축된 초기의 특정 작업에 대한 성능을 개선하기 위해 작업별 데이터 세트에서 모델을 추가로 훈련하는 프로세스를 말합니다. 예를 들어, COCO 또는 ImageNet과 같은 대규모 이미지 세트를 사용하여 범용 객체 감지 모델을 만든 다음, 자동차 감지에 특화된 더 작은 라벨이 지정된 데이터 세트로 결과 모델을 추가로 훈련할 수 있습니다. 이러한 방식으로 사용자는 차량 감지를 위한 물체 감지 모델을 미세 조정합니다. 반면, 전이 학습은 사용자가 동일한 문제가 아닌 새로운 관련 문제에 모델을 적용하는 것을 의미합니다.
실제 머신 러닝과 인공 지능 분야에서 전이 학습은 다양한 용도로 사용됩니다. 개발자와 데이터 과학자는 전이 학습을 사용하여 수많은 작업을 지원하고 강화 학습과 같은 다른 학습 접근 방식과 결합할 수 있습니다.
NLP에서 전이 학습에 영향을 미치는 한 가지 두드러진 문제는 기능 불일치입니다. 서로 다른 도메인의 기능은 서로 다른 의미를 가질 수 있으므로 함축된 의미가 다를 수 있습니다(예: 빛은 무게와 광학을 나타냅니다). 이러한 기능 표현의 차이는 감정 분류 작업, 언어 모델 등에 영향을 미칩니다. 딥러닝 기반 모델, 특히 단어 임베딩은 도메인 적응 작업을 위한 의미 관계와 방향을 적절히 포착할 수 있기 때문에 이러한 문제를 해결할 수 있는 잠재력을 보여줍니다.12
다양한 컴퓨팅 비전 작업을 위해 수동으로 라벨이 지정된 데이터를 충분히 확보하는 것이 어렵기 때문에, 많은 연구에서 컨볼루션 신경망(CNN)을 사용한 전이 학습 애플리케이션을 검토하고 있습니다. 한 가지 주목할 만한 예는 이미지 분류 및 개체 감지 작업에서 향상된 성능을 보여주는 사전 훈련된 모델 아키텍처인 ResNet입니다.13 최근 연구에서는 전이 학습을 위한 유명한 ImageNet 데이터 세트를 조사하여(컴퓨팅 비전의 통념과 반대로) 안정적으로 일반화 가능한 모델을 훈련하려면 이 데이터 세트의 작은 하위 집합만 있으면 된다고 주장합니다.14 컴퓨팅 비전을 위한 많은 전이 학습 튜토리얼에서는 TensorFlow의 keras 라이브러리와 함께 ResNet과 ImageNet을 모두 사용하거나 둘 중 하나를 사용합니다.
AI 빌더를 위한 차세대 엔터프라이즈 스튜디오인 IBM watsonx.ai로 생성형 AI, 파운데이션 모델 및 머신 러닝 기능을 학습, 검증, 조정 및 배포하세요. 적은 데이터로 짧은 시간 내에 AI 애플리케이션을 구축하세요.
업계 최고의 AI 전문성과 솔루션 포트폴리오를 보유한 IBM과 함께 AI를 비즈니스에 활용하세요.
AI 추가를 통해 중요한 워크플로와 운영을 혁신함으로써 경험, 실시간 의사 결정 및 비즈니스 가치를 극대화합니다.