블랙박스 AI 모델은 개발자가 의도적으로 블랙박스로 만들거나 학습의 부산물로 블랙박스가 되는 두 가지 이유 중 하나로 발생합니다.

일부 AI 개발자와 프로그래머는 AI 도구를 대중에게 공개하기 전에 내부 작동 방식을 모호하게 만들며, 이러한 전술은 종종 지적 재산을 보호하기 위한 것입니다. 시스템 제작자는 해당 시스템의 작동 방식을 정확히 알고 있지만 소스 코드와 의사 결정 프로세스를 비밀로 유지합니다. 이러한 이유로 기존의 많은 규칙 기반 AI 알고리즘은 블랙박스입니다.

그러나 생성형 AI 도구를 포함한 최첨단 AI 기술 중 다수는 '유기적 블랙박스'라고 할 수 있습니다. 이러한 도구의 제작자는 의도적으로 도구의 작업을 모호하게 만들지 않습니다. 오히려 이러한 모델을 구동하는 딥러닝 시스템이 너무 복잡하여 제작자 자신조차도 그 내부에서 무슨 일이 일어나는지 정확히 이해하지 못합니다.

딥러닝 알고리즘은 다층 신경망을 사용하는 머신 러닝 알고리즘의 일종입니다. 기존 머신 러닝 모델은 하나 또는 두 개의 계층이 있는 네트워크를 사용할 수 있는 반면, 딥러닝 모델에는 수백 또는 수천 개의 계층이 있을 수 있습니다. 각 계층에는 인간 두뇌의 기능을 모방하도록 설계된 코드 묶음인 뉴런이 다수 포함되어 있습니다.

심층 신경망은 사람의 개입 없이도 비정형 원시 빅데이터 세트를 소비하고 분석할 수 있습니다. 방대한 양의 데이터를 가져오고, 패턴을 식별하며, 이러한 패턴에서 학습하고, 학습한 내용을 사용하여 이미지, 비디오, 텍스트와 같은 새로운 아웃풋을 생성할 수 있습니다.

AI 시스템은 감독 없이 대규모 학습을 할 수 있는 이러한 능력을 덕분에 고급 언어 처리, 독창적인 콘텐츠 생성, 인간 지능에 가까워 보일 수 있는 기타 업무와 같은 작업을 수행할 수 있습니다.

그러나 이러한 신경망은 본질적으로 불투명합니다. AI 개발자를 포함한 사용자는 '가시 계층'이라고도 하는 입력 및 아웃풋 계층에서 어떤 일이 일어나는지 볼 수 있습니다. 들어가는 데이터와 나오는 예측, 분류 또는 기타 콘텐츠를 볼 수 있습니다. 그러나 그 사이의 모든 네트워크 계층, 즉 소위 '숨겨진 계층'에서 무슨 일이 일어나는지는 모릅니다.

AI 개발자는 데이터가 네트워크의 각 계층을 통해 이동하는 방식을 폭넓게 알고 있으며 모델이 수집한 데이터로 무엇을 하는지에 대해 일반적으로 파악하고 있습니다. 그러나 모든 세부 사항을 아는 것은 아닙니다. 예를 들어, 특정 뉴런 조합이 활성화될 때 그것이 무엇을 의미하는지, 또는 모델이 프롬프트에 응답하기 위해 벡터 임베딩을 어떻게 찾아 결합하는지는 정확히 알지 못할 수도 있습니다.

기본 코드를 공유하는 오픈 소스 AI 모델조차도 모델이 활성화되어 있을 때 모델의 각 계층 내에서 일어나는 일을 사용자가 여전히 해석할 수 없기 때문에 궁극적으로 블랙박스인 모델입니다.