오늘날 AI에 대한 대부분의 관심은 모델이 생성하는 아웃풋, 모델이 얼마나 정확하거나 설득력 있는지, 벤치마크와 비교하여 얼마나 잘 수행되는지 등에 초점을 맞추고 있습니다. 그러나 Hagerty의 경우 진정한 윤리적 긴장은 파운데이션 모델 수준에서 더 일찍 시작됩니다. 이는 웹에서 스크랩한 방대한 데이터 세트로 학습된 머신 러닝의 기본 계층인 최신 AI의 원시 인프라입니다. 이것이 바로 ChatGPT 및 Claude와 같은 대규모 언어 모델(LLM)의 원동력입니다.

Hagerty는 "파운데이션은 모든 일이 일어나는 곳입니다."라고 말합니다. "이것이 시스템이 가장 먼저 학습하는 것이며, 시스템이 쓰레기로 가득 차 있으면 그 쓰레기는 사라지지 않습니다."

이러한 기본 모델은 범용으로 설계되었습니다. 이것이 바로 이들을 강력하면서도 위험하게 만드는 이유라고 Hagerty는 말합니다. 특정 작업이나 제약 조건을 염두에 두고 구축되지 않았기 때문에 귀중한 의미 구조부터 유해한 인터넷 슬러지에 이르기까지 모든 것을 흡수하는 경향이 있습니다. 그리고 일단 훈련된 모델은 감사하기가 어렵습니다. 제작자조차도 모델이 무엇을 알고 있는지 또는 주어진 프롬프트에 어떻게 반응할지 확실히 말할 수 없는 경우가 많습니다.

Hagerty는 이를 고층 빌딩에 결함이 있는 콘크리트 바닥을 붓는 것에 비유했습니다. 처음부터 믹스가 잘못되면 균열이 즉시 보이지 않을 수 있습니다. 하지만 시간이 지나면 구조가 불안정해집니다. AI에서는 시스템이 배포된 후 취약한 행동, 의도하지 않은 편향 또는 치명적인 오용이 이에 해당합니다. 모델을 초기에 세심하게 구성하지 않으면 학습 중에 흡수했던 위험을 모든 애플리케이션에 전달합니다.

이 문제는 그뿐만이 아닙니다. 스탠포드 대학의 파운데이션 모델 연구 센터(CRFM)의 연구원들은 편향 전파, 지식 할루시네이션, 데이터 오염, 장애 파악의 어려움 등 대규모 학습의 새로운 위험에 대해 반복해서 경고해 왔습니다. 이러한 문제는 완화할 수는 있지만 제거할 수는 없으므로 데이터 큐레이션, 필터링 및 거버넌스와 같은 초기 설계 선택이 더욱 중요해집니다.

Hagerty의 견해에 따르면, 의미 있는 발전을 가로막는 가장 큰 윤리적 장벽 중 하나는 기업이 'AI'라고 할 때 의미하는 바가 모호하다는 점입니다. 5개의 제품 팀에게 'AI 기반'이 무엇을 의미하는지 물어보면 다섯 가지 다른 답변을 얻을 수 있습니다. Hagerty는 이러한 모호한 정의을 현 시대의 핵심적인 윤리적 실패 중 하나로 보고 있습니다.

“대부분의 사람들이 AI라고 하면 자동화를 의미합니다. 또는 의사결정트리를 의미하죠. 또는 if/else 문일 수도 있습니다."라고 그는 말합니다.

용어가 명확하지 않다는 것은 학문적인 문제가 아닙니다. 기업이 결정론적 소프트웨어를 지능형 추론으로 제시하면 사용자는 이를 신뢰하는 경향이 있습니다. 스타트업이 기본 검색 및 필터 툴을 생성 모델로 내세우면 투자자들은 신기루에 돈을 쏟아붓습니다. Hagerty는 이를 '과장된 정보 유출'이라고 부르며, 이것이 혼란과 평판 손상의 원인이 되고 있다고 보고 있습니다.

금융이나 의료와 같은 규제 대상 산업에서는 그 결과가 더 심각할 수 있습니다. 사용자가 시스템이 실제보다 더 깊은 인식을 가지고 있다고 착각하면, 사람이 해야 할 결정을 시스템에 위임할 수 있습니다. 툴과 에이전트 사이의 경계가 모호해지면서 책임 소재도 모호해집니다.

이 문제는 또한 노력 낭비로 이어집니다. Hagerty는 최근 연구 에 의한 시계열 예측에 오용된 사례를 인용했으며, 이는 과거 데이터를 기반으로 미래 값을 예측하는 통계적 방법으로, 고전 방법이 더 정확하고 효율적으로 유지되는 작업임을 강조했습니다. 그러나 일부 기업은 어쨌든 새로운 것을 쫓거나 혁신을 알리기 위해 LLM을 계속 사용하고 있습니다.

"잘못된 답변을 얻기 위해 GPU를 태우고 있습니다."라고 그는 말했습니다. "그리고 더 나쁜 것은 그것을 진보라고 부른다는 것입니다."

윤리적 문제는 비효율성만이 아닙니다. 이는 잘못된 정보입니다. 팀은 자신이 거의 이해하지 못하는 기술을 중심으로 제품을 만들고, 자신의 기능을 과장하는 마케팅을 추가하고, 사용 중인 제품을 평가할 방법이 없는 사용자에게 이를 배포합니다.