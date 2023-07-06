이러한 컴퓨터 과학 용어는 종종 같은 의미로 사용됩니다. 그렇다면 각 기술을 고유하게 만드는 차이점은 무엇일까요?
기술은 시시각각 우리의 일상에 더욱 깊숙이 스며들고 있습니다. 소비자의 기대에 부응하기 위해 기업들은 머신 러닝 알고리즘에 점점 더 의존해 작업을 간소화합니다. 그 적용 사례는 소셜 미디어(사진 속 사물 인식을 통해)에서, 그리고 장치와 직접 대화하는 Alexa나 Siri 같은 기술에서 찾아볼 수 있습니다.
인공지능(AI), 머신 러닝(ML), 딥 러닝, 신경망은 서로 연관된 기술이지만, 용어들이 종종 같은 의미로 사용되며 각각의 차이점을 혼동할 때가 많습니다. 이 블로그 게시물에서는 모호했던 부분을 조금 더 정확하게 살펴보겠습니다.
AI, 머신 러닝, 딥 러닝, 신경망을 이해하는 가장 쉬운 방법은 가장 큰 것부터 가장 작은 것까지 각각을 수용하는 일련의 AI 시스템으로 생각하는 것입니다.
AI는 가장 중요한 시스템입니다. 머신 러닝은 AI의 하위 집합입니다. 딥 러닝은 머신 러닝의 하위 분야이며, 신경망은 딥 러닝 알고리즘의 중추를 구성합니다. 단일 신경망은 신경망의 노드 레이어 수 또는 깊이를 통해 딥 러닝 알고리즘과 구별할 수 있고, 딥 러닝 알고리즘에는 3개 이상이 있어야 합니다.
3가지 용어 중 가장 광범위한 용어인 인공지능(AI)은 인간의 지능과 문제 해결, 학습과 같은 인간의 인지 기능을 모방한 기계를 분류하는 데 사용됩니다. AI는 자동화와 예측을 사용해 얼굴 및 음성 인식, 의사 결정 및 번역과 같이 인간이 해왔던 복잡한 작업을 최적화하고 해결합니다.
AI의 3가지 주요 범주는 다음과 같습니다.
ANI는 '약'인공지능으로 간주되고, 다른 두 가지 유형은 '강'인공지능으로 분류됩니다. 우리는 체스 게임에서 이기거나 일련의 사진에서 사람을 식별하는 것과 같은 특정 작업을 완료하는 능력이 있는 인공지능을 약인공지능으로 정의합니다. 기업이 작업을 자동화하고 챗봇과 Siri, Alexa와 같은 가상 비서를 개발하도록 뒷받침하는 자연어 처리와 컴퓨팅 비전이 ANI의 예입니다. 컴퓨팅 비전은 자율 주행 자동차의 요소입니다.
AGI, ASI처럼 더 강력한 형태의 AI는 어조와 감정을 해석하는 능력과 같이 인간의 행동을 더 두드러지게 통합합니다. 강인공지능은 인간과 비견할 만한 능력으로 정의됩니다. AGI는 다른 인간과 동등한 성능을 발휘하는 반면, 초지능으로도 불리는 ASI는 인간의 지능과 능력을 능가합니다. 이 두 가지 형태의 강인공지능은 아직 존재하지 않지만, 이 분야에 대한 연구는 계속 진행 중입니다.
전 세계적으로 약 35%의 기업이 AI를 사용하고 있고, 42%는 이 기술을 검토하고 있습니다. 레이블이 지정되지 않은 대량의 데이터를 학습하는 강력한 기반 모델을 사용하는 생성형 AI의 개발은 새로운 사용 사례에 맞게 조정될 수 있으며 AI 채택을 크게 가속화할 수 있는 유연성과 확장성을 제공할 수 있습니다. 초기 테스트에서 IBM은 생성형 AI가 기존 AI보다 최대 70% 더 빠르게 가치 실현 시간을 단축하는 것을 확인했습니다.
ML 기반 AI 애플리케이션을 사용하든, 파운데이션 모델을 사용하든, AI는 비즈니스에 경쟁 우위를 제공할 수 있습니다. 맞춤형 AI 모델을 워크플로에 통합하고 고객 서비스, 공급망 관리, 사이버 보안과 같은 기능을 자동화하면 비즈니스가 현재의, 그리고 미래에는 더욱 높아질 고객의 기대치를 충족하는 데 도움이 될 수 있습니다.
핵심은 양질의 데이터를 사용해 가장 실질적인 경쟁 우위를 확보하는 데 도움이 될 수 있도록 처음부터 올바른 데이터 집합을 식별하는 것입니다. 또한, 데이터가 메인프레임, 데이터 센터, 프라이빗/퍼블릭 클라우드, 엣지 등 어디에 저장되어 있든 데이터를 성공적으로 사용할 수 있는 하이브리드 AI 지원 아키텍처를 구축해야 합니다.
AI는 신뢰할 수 있어야 합니다. 그렇지 않으면 기업의 평판이 손상되고 규제에 따른 벌금이 부과될 수 있습니다. 오해의 소지가 있는 모델과 편견이 포함된 모델이나 할루시네이션을 일으키는 모델을 사용하면 고객의 개인정보 보호, 데이터 권리, 신뢰에 막대한 손실을 초래할 수 있습니다. AI는 설명 가능하고, 공정하며, 투명해야 합니다.
머신 러닝은 최적화를 가능하게 하는 AI의 하위 집합입니다. 올바르게 설정하면 단순한 추측으로 인해 발생하는 오류를 최소화하는 예측을 할 수 있습니다. 예를 들어, Amazon과 같은 회사는 머신 러닝을 사용해 특정 고객이 이전에 보고 구매한 것을 기반으로 제품을 추천합니다.
클래식 또는 '논딥' 머신 러닝은 컴퓨터 시스템이 패턴을 식별하고, 학습하고, 특정 작업을 수행하고, 정확한 결과를 제공할 수 있도록 인간의 개입에 의존합니다. 인간 전문가가 데이터 입력 간의 차이를 이해하기 위해 기능의 계층 구조를 결정하며, 일반적으로 학습을 위해서는 보다 구조화된 데이터가 필요합니다.
예를 들어, '피자', '버거', '타코' 등 다양한 종류의 패스트푸드 이미지가 있다고 가정해 보겠습니다. 이러한 이미지를 분석하는 인간 전문가는 각 사진을 특정 패스트푸드 유형으로 구분하는 특징을 파악합니다. 각 음식의 종류에 따라 빵의 특징이 다를 수 있습니다. 또는 '피자', '버거', '타코' 같은 레이블을 사용해 지도 학습을 통해 학습 과정을 간소화할 수도 있습니다.
딥 머신 러닝으로 불리는 AI의 하위 집합은 레이블이 지정된 데이터 세트를 활용해 지도 학습의 알고리즘에 정보를 제공할 수 있지만, 반드시 레이블이 지정된 데이터 세트가 필요한 것은 아닙니다. 텍스트, 이미지와 같은 원시 형태의 비정형 데이터를 수집할 수 있고 '피자', '햄버거', '타코'를 구별하는 특징 집합을 자동으로 결정할 수 있습니다. 사람들이 생성하는 빅데이터가 증가함에 따라 데이터 과학자들이 머신 러닝을 사용하는 사례는 점점 더 많아지고 있습니다. 이러한 접근 방식의 차이점에 관한 보다 자세한 내용은 '지도 학습 vs 비지도 학습: 그 차이점은?'을 참고하세요.
머신 러닝의 세 번째 범주는 강화 학습으로, 컴퓨터가 주변과 상호 작용하고 행동에 대한 피드백(보상 또는 페널티)을 받아 학습합니다. 그리고 온라인 학습은 데이터 과학자가 새로운 데이터를 사용할 수 있게 되면 ML 모델을 업데이트하는 ML의 한 유형입니다.
다음 동영상에서 머신 러닝에 대해 더 자세히 살펴보세요.
딥 러닝에 관한 글에서 설명했듯이 딥 러닝은 머신 러닝의 하위 집합입니다. 머신 러닝과 딥 러닝의 주요 차이점은 각 알고리즘이 학습하는 방식과 각 알고리즘 유형이 사용하는 데이터의 양입니다.
딥 러닝은 프로세스의 특징 추출 부분의 대부분을 자동화해 필요한 수동 개입 중 일부를 제거합니다. 또한 대규모 데이터 세트를 사용할 수 있어 확장 가능한 머신 러닝이라는 타이틀을 얻었습니다. 특히 조직 데이터의 80% 이상이 비정형 데이터인 것으로 추정되는 만큼, 비정형 데이터의 사용을 자세히 탐구할수록 그 기능이 더욱 기대되고 있습니다.
데이터의 패턴을 관찰하면 딥러닝 모델이 입력을 적절하게 클러스터링할 수 있습니다. 앞서 제시한 동일한 예를 들어 피자, 햄버거, 타코 사진을 이미지에서 식별된 유사점 또는 차이점에 따라 각각의 카테고리로 그룹화할 수 있습니다. 딥 러닝 모델은 정확도를 높이려면 더 많은 데이터 포인트가 필요하지만, 머신 러닝 모델은 기본적인 데이터 구조가 달라 더 적은 데이터를 사용합니다. 기업은 일반적으로 가상 비서나 사기 탐지 같은 보다 복잡한 작업에 딥 러닝을 사용합니다.
인공 신경망 또는 시뮬레이션된 신경망이라고도 불리는 신경망은 머신 러닝의 하위 집합이며 딥 러닝 알고리즘의 중추입니다. 이것이 '신경'망으로 불리는 이유는 뇌의 뉴런이 서로에게 신호를 보내는 방식을 모방하기 때문입니다.
신경망은 노드 계층, 입력 계층, 하나 이상의 숨겨진 계층, 출력 계층으로 구성됩니다. 각 노드는 다음 노드에 연결되는 인공 뉴런이며 각각 가중치와 임곗값을 가지고 있습니다. 한 노드의 출력이 임곗값을 초과하면 노드가 활성화되어 네트워크의 다음 계층으로 데이터를 전송합니다. 임곗값보다 낮으면 데이터가 전달되지 않습니다.
학습 데이터는 신경망을 학습시키는 역할을 하며, 시간이 지남에 따라 신경망의 정확도를 향상시키도록 도와줍니다. 학습 알고리즘을 미세 조정하면 데이터를 빠르게 분류하고 클러스터링할 수 있어 더욱 강력한 컴퓨터 과학 도구와 AI 도구가 됩니다. 신경망을 사용하면 수동으로 수행할 때 몇 시간이 걸리던 음성 및 이미지 인식 작업을 몇 분 만에 완료할 수 있습니다. 우리가 잘 알고 있는 신경망의 예시로는 Google의 검색 알고리즘이 있습니다.
신경망에 관한 위의 설명에서도 언급했지만, 보다 명확하게 설명하면 딥 러닝의 '딥'은 신경망 계층의 깊이를 의미합니다. 입력과 출력을 포함해 3개 이상의 계층으로 구성된 신경망은 딥 러닝 알고리즘으로 간주될 수 있습니다. 이를 다이어그램으로 표현하면 다음과 같습니다.
대부분의 심층 신경망은 피드 포워드 방식으로, 입력에서 출력까지 한 방향으로만 흐릅니다. 하지만 역전파를 통해 모델을 학습시켜 반대 방향인 출력에서 입력으로 이동하는 것도 가능합니다. 역전파를 사용하면 각 뉴런과 관련된 오류를 계산하고 귀속시킬 수 있어 알고리즘을 적절하게 조정하고 맞출 수 있습니다.
AI의 이러한 모든 영역은 비즈니스 영역을 간소화하고 고객 경험을 개선하는 데 도움이 될 수 있지만, 먼저 데이터를 관리하기 위한 학습 알고리즘을 구성할 수 있는 올바른 시스템이 있는지 확인해야 하기 때문에 AI 목표를 달성하는 것은 어려울 수 있습니다. 데이터 관리는 단순히 비즈니스에 사용하는 모델을 구축하는 작업에 국한되지 않습니다. 구축을 시작하기 전에 데이터를 저장할 장소와 데이터를 정리하고 편향을 제어하기 위한 메커니즘이 필요합니다.
IBM은 파운데이션 모델, 생성형 AI, 머신 러닝, IBM® watsonx.ai™를 위한 새로운 스튜디오에서 머신 러닝과 인공 지능의 힘을 결합하고 있습니다.
