업계 뉴스레터
전문가가 전하는 최신 AI 트렌드
가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.
구독은 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
AI 추론은 AI 기술의 발전에 매우 중요하며 인기 있는 ChatGPT 애플리케이션을 구동하는 기능인 생성형 AI와 같은 가장 흥미로운 애플리케이션을 지원합니다. AI 모델은 AI 추론에 의존하여 사람들이 생각하고, 추론하고, 프롬프트에 응답하는 방식을 모방합니다.
AI 추론은 의사 결정 알고리즘을 사용하여 대규모 데이터 세트를 기반으로 AI 모델을 학습시키는 것으로 시작됩니다. AI 모델은 인간의 두뇌처럼 구성된 신경망—대규모 언어 모델(LLM)에서 학습된 의사 결정 알고리즘으로 구성됩니다. 예를 들어 얼굴 인식을 위해 설계된 AI 모델은 수백만 개의 사람 얼굴 이미지로 학습할 수 있습니다. 결국 눈 색깔, 코 모양, 머리 색깔과 같은 특징을 정확하게 식별하는 방법을 학습한 다음 이를 사용해 이미지에서 개인을 인식할 수 있습니다.
업계 뉴스레터
가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.
구독은 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
AI 모델이 해당 애플리케이션에 적합한 강력한 데이터 세트를 기반으로 학습되지 않는다면 그 효과는 미미할 수밖에 없습니다. 기술의 민감한 특성과 언론의 면밀한 조사가 이루어지고 있는 점을 고려할 때1, 기업들은 이에 대한 신중한 접근이 필요합니다. 그러나 산업 전반에 걸쳐 디지털 혁신과 확장 가능한 혁신의 잠재력을 제공하는 애플리케이션 사용함으로써 다음과 같은 많은 이점을 얻을 수 있습니다.
AI 추론은 많은 이점을 제공하지만, 빠르게 성장하는 신생 기술이기 때문에 어려움도 없지 않습니다. 다음은 AI에 투자하려는 기업이 고려해야 할 업계가 직면한 몇 가지 문제입니다.
AI 추론은 정확한 응답을 추론할 수 있을 때까지 적절한 데이터 세트에서 AI 모델을 훈련시키는 복잡한 프로세스입니다. 이는 매우 컴퓨팅 집약적인 프로세스이며 특수 하드웨어와 소프트웨어가 필요합니다. AI 추론을 위해 AI 모델을 훈련하는 프로세스를 살펴보기 전에 이를 가능하게 하는 몇 가지 특수 하드웨어를 살펴보겠습니다.
중앙 처리 장치(CPU)는 컴퓨터의 주요 기능 구성 요소입니다. AI 학습 및 추론에서 CPU는 운영 체제를 실행하고 학습 목적에 필요한 컴퓨팅 리소스를 관리하는 데 도움을 줍니다.
그래픽 처리 장치(GPU) 또는 고성능 컴퓨터 그래픽 및 이미지 처리를 위해 설계된 전자 회로는 비디오 카드, 마더보드 및 휴대폰을 비롯한 다양한 장치에 사용됩니다. 그러나 병렬 처리 기능으로 인해 AI 모델 훈련에도 점점 더 많이 사용되고 있습니다. 한 가지 방법은 많은 GPU를 단일 AI 시스템에 연결하여 해당 시스템의 처리 능력을 높이는 것입니다.
필드 프로그래머블 게이트 어레이(FPGA)는 특정 목적에 맞게 재프로그래밍할 수 있는 전문 지식에 의존하는 고도로 사용자 정의 가능한 AI 가속기입니다. 다른 AI 가속기와 달리 FPGA는 특정 기능에 적합한 고유한 설계를 가지고 있으며, AI 추론에 중요한 실시간 데이터 처리와 관련이 있는 경우가 많습니다. FPGA는 하드웨어 수준에서 재프로그래밍이 가능하므로 더 높은 수준의 사용자 정의가 가능합니다.
ASIC은 특정 목적이나 워크로드를 염두에 두고 설계된 AI 가속기로, Cerebras에서 생산한 WSE-3 ASIC 가속기의 경우 딥 러닝과 같은 특정 목적을 위해 설계되었습니다. ASIC은 데이터 과학자가 AI 추론 기능을 가속화하고 비용을 절감하는 데 도움이 됩니다. FPGA와 달리 ASIC은 재프로그래밍할 수 없지만, 단일 목적으로 제작되었기 때문에 일반적으로 다른 범용 가속기보다 성능이 뛰어납니다. TensorFlow 소프트웨어를 사용하여 신경망 머신 러닝을 위해 개발된 Google의 Tensor Processing Unit(TPU)을 예로 들 수 있습니다.
디지털 혁신 여정의 일환으로 AI 애플리케이션에 투자하는 데 관심이 있는 기업은 AI 추론의 이점과 과제에 대해 교육받아야 합니다. 다양한 응용 분야를 철저히 조사하고 이를 활용할 준비가 된 분들을 위해 효과적인 AI 추론을 구축하는 5가지 단계를 소개합니다.
효과적인 AI 모델과 애플리케이션을 만들려면 데이터를 준비하는 것이 중요합니다. 기업은 조직 내부 또는 외부의 데이터를 사용하여 AI 모델이 학습할 데이터 세트를 만들 수 있습니다. 최적의 결과를 얻으려면 두 가지를 조합하여 사용하는 것이 일반적입니다. AI가 학습할 데이터를 조합할 때 또 다른 중요한 부분은 데이터를 정리하는 것입니다. 즉, 중복 항목을 제거하고 서식 문제를 해결하는 것입니다.
데이터 세트를 조합하고 나면 다음 단계는 애플리케이션에 적합한 AI 모델을 선택하는 것입니다. 모델은 단순한 것부터 복잡한 것까지 다양하며, 복잡한 모델은 덜 복잡한 모델보다 더 많은 입력을 수용하고 더 미묘한 수준에서 추론할 수 있습니다. 더 복잡한 모델을 훈련시키는 것은 더 간단한 모델을 훈련시키는 것보다 더 많은 시간, 비용 및 기타 리소스가 필요할 수 있으므로 이 단계에서는 요구 사항을 명확히 하는 것이 중요합니다.
AI 애플리케이션에서 원하는 결과를 얻으려면 기업은 일반적으로 엄격한 AI 교육을 여러 차례 거쳐야 합니다. 모델이 학습함에 따라 추론의 정확도는 더욱 높아질 것이며 이러한 추론에 도달하는 데 필요한 컴퓨팅 리소스(예: 컴퓨팅 파워 및 지연 시간)의 양은 줄어들 것입니다. 모델이 성숙해짐에 따라 학습한 데이터에서 새로운 데이터에 대한 추론을 시작할 수 있는 새로운 단계로 전환됩니다. 이 단계는 모델이 설계된 방식대로 작동하기 시작하는 것을 볼 수 있기 때문에 매우 흥미로운 단계입니다.
모델이 작동 가능하다고 간주되기 전에 아웃풋에 부정확성, 편향 또는 데이터 개인정보 보호 문제가 있는지 확인하고 모니터링하는 것이 중요합니다. 포스트 프로세싱이라고도 하는 이 단계에서는 모델의 정확성을 보장하기 위한 단계별 프로세스를 생성합니다. 포스트 프로세싱 단계는 AI가 원하는 답변을 제공하고 의도한 방식으로 작동하도록 하는 방법론을 만드는 단계입니다.
엄격한 모니터링과 포스트 프로세싱을 거치면 AI 모델을 비즈니스에 배포할 수 있습니다. 이 마지막 단계에는 AI 모델이 작동할 수 있도록 하는 아키텍처 및 데이터 시스템을 구현하고, 이해관계자에게 일상적인 역할에서 AI 애플리케이션을 사용하는 방법을 교육하기 위한 변경 관리 절차를 만드는 것이 포함됩니다.
기업에서 필요로 하는 AI 애플리케이션의 종류에 따라 선택할 수 있는 AI 추론의 유형은 다양합니다. 기업이 사물인터넷(IoT) 애플리케이션에 사용할 AI 모델을 구축하려는 경우, 측정 기능을 갖춘 스트리밍 추론이 가장 적합한 선택일 수 있습니다. 그러나 AI 모델이 인간과 상호 작용하도록 설계된 경우 온라인 추론(LLM 기능 포함)이 더 적합할 수 있습니다. 다음은 세 가지 유형의 AI 추론과 각각의 고유한 특징입니다.
온라인 추론이라고도 하는 동적 추론은 가장 빠른 유형의 AI 추론이며 OpenAI의 ChatGPT와 같은 가장 널리 사용되는 LLM AI 애플리케이션에서 사용됩니다. 동적 추론은 요청되는 즉시 아웃풋과 예측을 수행하며, 그 후에는 작동하기 위해 짧은 지연 시간과 데이터에 대한 빠른 액세스가 필요합니다. 동적 추론의 또 다른 특징은 아웃풋이 너무 빨라서 최종 사용자에게 도달하기 전에 이를 검토할 시간이 없다는 것입니다. 이로 인해 일부 기업에서는 품질 관리를 위해 아웃풋과 최종 사용자 사이에 모니터링 계층을 추가하기도 합니다.
일괄 추론은 대량의 데이터를 사용하여 오프라인에서 AI 예측을 생성합니다. 일괄 추론 접근 방식을 사용하면 이전에 수집된 데이터가 ML 알고리즘에 적용됩니다. 몇 초 이내에 아웃풋이 필요한 상황에는 적합하지 않지만, 일괄 추론은 영업 또는 마케팅 대시보드나 위험 평가처럼 하루 종일 또는 일주일에 걸쳐 정기적으로 업데이트되는 AI 예측에 적합할 수 있습니다.
스트리밍 추론은 일반적으로 센서의 정기적인 측정을 통해 공급되는 데이터 파이프라인을 사용하여 데이터를 사용하여 지속적으로 계산과 예측을 수행하는 알고리즘에 이를 공급합니다. 인터넷에 연결된 센서를 통해 발전소나 도시의 교통 상황을 모니터링하는 데 사용되는 AI와 같은 IoT 애플리케이션은 스트리밍 추론에 의존하여 의사 결정을 내립니다.
AI 빌더를 위한 차세대 엔터프라이즈 스튜디오인 IBM watsonx.ai로 생성형 AI, 파운데이션 모델 및 머신 러닝 기능을 학습, 검증, 조정 및 배포하세요. 적은 데이터로 짧은 시간 내에 AI 애플리케이션을 구축하세요.
업계 최고의 AI 전문성과 솔루션 포트폴리오를 보유한 IBM과 함께 AI를 비즈니스에 활용하세요.
AI 추가를 통해 중요한 워크플로와 운영을 혁신함으로써 경험, 실시간 의사 결정 및 비즈니스 가치를 극대화합니다.
1 “Why Companies Are Vastly Underprepared For The Risks Posed By AI”, Forbes, June 15, 2023
2 “Onshoring Semiconductor Production: National Security Versus Economic Efficiency”, Council on Foreign Relations, April 2024