ChatGPT의 위험과 대안 살펴보기: 신뢰할 수 있는 AI를 향한 길 개척

컴퓨터를 사용하는 여성 연구원

친구들이 즐길 수 있는 스무디를 만들고 있습니다. 이미 모듬 과일과 요거트를 섞은 후, 친구 Ruchir가 잘 익은 사과를 들고와 건내주며 상큼한 걸작을 완성하게 해줍니다. 이제 음료가 완성되었고, 음료를 따르는 동안에도 여전히 사과 향이 살짝 느껴집니다. 첫 잔을 마시기 전에 Ruchir는 "마음이 바뀌어 사과를 돌려받고 싶어"라고 말합니다. 나는 "아, 미안하지만 불가능해"라고 대답합니다. 잠시 후 이 이야기로 돌아와서 ChatGPT 및 신뢰할 수 있는 AI와 어떤 관련이 있는지 설명하겠습니다.

인공 지능(AI) 세계가 진화함에 따라, OpenAI의 ChatGPT와 같은 새로운 툴이 대화 능력으로 주목받고 있습니다. 그럼에도 불구하고 조직 내에서 직접 도입하기 전에 내재된 위험을 평가하는 것이 얼마나 중요한지 잘 알고 있습니다. 이 토론에서는 엔터프라이즈 환경에서 구현에 신중한 접근 방식이 필요하도록 만드는 ChatGPT 관련 위험과 과제를 살펴봅니다. 또한 신뢰할 수 있는 AI 솔루션을 확보하기 위한 IBM® watsonx 도입의 중요성을 강조합니다. 그리고 확실하지 않은 경우 새로운 인터넷 서비스를 사용할 때 항상 사용하던 것과 동일한 상식을 사용할 것을 권장합니다.

AI 툴의 진화

ChatGPT는 다양한 AI 애플리케이션에 사용되는 '거대'하고 널리 사용되는 대규모 언어 모델이라는 새로운 클래스에 속하는 GPT-3(ibm.com 외부 링크)와 GPT-4의 막강한 성능을 활용합니다. ChatGPT를 통해 사용자는 질문하고, 텍스트를 생성하고, 이메일 초안을 작성하고, 다양한 프로그래밍 언어로 코드에 대해 논의하고, 자연어를 코드로 번역하는 등의 작업을 수행할 수 있습니다. 일관되고 상황에 맞는 응답을 제공하는 것을 목표로 하는 고품질 대화형 챗봇으로 두각을 나타내고 있습니다.

ChatGPT는 창의적인 글쓰기를 탐색하고 아이디어를 창출하며 AI와 상호 작용할 수 있는 훌륭한 도구입니다. 누구나 무료로 사용할 수 있으며,ChatGPT Plus 구독자에게는 고급 버전이 제공됩니다. 이 챗봇은 이전 대화를 기억할 수 있는 능력을 갖추고 있어 더욱 상호작용적이고 매력적인 경험을 제공합니다.

ChatGPT는 상당한 관심과 인기를 얻고 있지만, 다른 AI 기반 챗봇 및 자연어 처리(NLP) 시스템과의 경쟁에 직면해 있습니다. 예를 들어 구글은 자사의 AI 챗봇 Bard를 개발했으며, 이 챗봇은 PaLM 2라는 자체 언어 엔진으로 구동됩니다. 마찬가지로 Meta는 최근 인상적인 LLaMa2 모델을 출시했습니다. AI 챗봇 분야가 계속 발전함에 따라 경쟁이 치열해지고 새로운 경쟁자가 등장할 것입니다. 기업의 요구에 가장 적합한 솔루션을 모색하기 위해서는 이 분야의 발전에 대한 최신 정보를 파악하는 것이 필수적입니다.

기업에서 직접 ChatGPT를 사용하는 것은 어떨까요?

기업에서 ChatGPT를 직접 사용하는 것은 위험과 과제를 수반합니다. 여기에는 보안 및 데이터 유출, 기밀성 및 책임 문제, 지식 재산의 복잡성, 오픈 소스 라이선스 준수, AI 개발에 대한 제한, 불확실한 개인정보 보호, 국제법 준수 등이 포함됩니다. 여기서는 이러한 위험을 살펴보고 이러한 위험이 일상적인 기업 활동에서 어떻게 나타날 수 있는지 보여주는 예시를 공유합니다.

먼저 엄격한 큐레이션과 거버넌스를 통해 데이터 소유권 및 개인정보 보호 문제를 해결하기 때문에 기업용으로 추천하는 IBM watsonx를 포함하여 ChatGPT를 직접 사용할 때 발생하는 위험을 완화할 수 있는 대체 솔루션을 살펴볼 것입니다. 이 대화를 마무리하며 스무디 이야기로 다시 돌아가겠습니다. 하지만 아래에서 '내 데이터'를 언급할 때는 '내 사과'로 바꾸셔도 됩니다.

대체 솔루션을 탐색하기 전에 기업이 ChatGPT를 직접 사용할 때 발생할 수 있는 잠재적 위험과 문제를 염두에 두는 것이 중요합니다. 다시 말하지만, 인터넷의 역사는 새로운 서비스(예: Google 검색, 소셜 미디어 플랫폼 등)의 출현과 진화를 보여 주었으며, 이는 기업에서 데이터 프라이버시와 소유권의 중요성을 강조합니다. 이를 염두에 두고 다음과 같은 주요 요소를 고려해야 합니다.

보안 및 데이터 유출

 

제삼자 또는 회사 내부 민감한 정보가 ChatGPT에 입력되면 이는 챗봇의 데이터 모델의 일부가 되며 관련 질문을 하는 다른 사람들과 공유될 수 있습니다. 이는 데이터 유출로 이어져 조직의 보안 정책을 위반할 수 있습니다.

예: 데이터 유출 및 잠재적 보안 침해의 위험을 피하기 위해 기밀 사양 및 마케팅 전략을 포함하여 팀이 고객 출시를 지원하는 신제품에 대한 계획을 ChatGPT와 공유해서는 안 됩니다.

기밀성 및 개인정보 보호

 

위의 요지와 유사하게, 고객 또는 파트너의 기밀 정보를 공유하는 것은 해당 정보를 보호하기 위한 계약 및 법적 요구 사항을 위반할 수 있습니다. ChatGPT의 보안이 침해되면 기밀 콘텐츠가 유출되어 조직의 평판에 영향을 미치고 책임에 노출될 수 있습니다.

예: 조직에서 ChatGPT를 사용하여 환자 문의에 응답하는 것을 지원한다고 가정해 보겠습니다. 의료 기록 또는 개인 건강 세부 정보와 같은 기밀 환자 정보가 ChatGPT와 공유되는 경우, 이는 건강 보험 양도 및 책임에 관한 법률(HIPAA)(ibm.com 외부 링크)과 같은 법률로 보호되는 법적 의무 및 환자 개인정보 보호 권리를 침해할 수 있습니다.

지식 재산 문제

 

ChatGPT에서 생성된 코드 또는 텍스트의 소유권은 복잡할 수 있습니다. 서비스 약관에는 아웃풋이 입력 제공자에게 속한다고 명시되어 있지만, 아웃풋이 다른 입력에서 가져온 법적으로 보호되는 데이터를 포함하는 경우 문제가 발생할 수 있습니다. 저작권 문제는 ChatGPT를 사용하여 저작권이 있는 자산에 기반한 서면 자료를 생성하는 경우에도 발생할 수 있습니다.

예: 마케팅 목적으로 서면 자료를 생성하고 아웃풋에 적절한 저작권 표시나 허가 없이 외부 소스의 저작권 보호 콘텐츠가 포함되어 있으면 원본 콘텐츠 제작자의 지식 재산권을 침해할 수 있습니다. 이는 법적 결과와 회사의 평판 손상을 초래할 수 있습니다.

오픈 소스 라이선스 규정 준수

 

ChatGPT가 오픈 소스 라이브러리를 활용하고 해당 코드를 제품에 통합하는 경우 오픈 소스 소프트웨어(OSS) 라이선스(예: GPL)를 위반하여 조직에 법적 문제를 일으킬 수 있습니다.

예: 회사에서 ChatGPT를 활용하여 소프트웨어 제품용 코드를 생성하고 GPT를 학습시키는 데 사용되는 학습 데이터의 출처가 불분명한 경우 해당 코드와 관련된 오픈 소스 라이선스 약관을 위반할 위험이 있습니다. 이로 인해 라이선스 침해 주장 및 오픈 소스 커뮤니티의 잠재적인 법적 조치를 포함한 법적 문제가 발생할 수 있습니다.

AI 개발의 한계

 

ChatGPT의 서비스 약관에는 다른 AI 시스템 개발에 사용할 수 없다고 명시되어 있습니다. 이러한 방식으로 ChatGPT를 사용하면 회사가 해당 분야에서 운영하는 경우 향후 AI 개발 계획을 방해할 수 있습니다.

예: 음성 인식 기술을 전문으로 하는 한 회사는 ChatGPT의 자연어 처리 기능을 통합하여 기존 시스템을 개선할 계획입니다. 그러나 ChatGPT의 서비스 약관에는 다른 AI 시스템 개발에는 사용할 수 없다고 명시되어 있습니다.

IBM Watsonx로 신뢰성 향상

스무디 이야기로 돌아가서, 공개 ChatGPT는 사과가 스무디에 맛을 더하는 것과 같이 프롬프트 데이터를 활용하여 신경망을 강화합니다. 갈아 넣은 사과처럼 데이터가 ChatGPT에 들어가면 데이터가 어떻게 사용되는지 제어하거나 알 수 없습니다. 따라서 사과를 포함할 완전한 권리가 있는지, 그리고 민감한 정보가 포함되어 있지 않은지 반드시 확인해야 합니다.

이러한 문제를 해결하기 위해 IBM watsonx는 큐레이팅되고 투명한 데이터와 모델을 제공하여 스무디 생성 및 사용에 대한 제어력과 신뢰성을 높입니다. 간단히 말해, Ruchir가 사과를 돌려달라고 요청하면 watsonx는 그의 요청을 들어줄 수 있습니다. 그럼 이제... 비유와 이야기가 완성되었습니다.

IBM watsonx는 세 가지 주요 기능인 watsonx.data, watsonx.ai, watsonx.governance를 소개합니다. 이러한 기능은 OpenAI 모델에는 아직 존재하지 않는 신뢰할 수 있는 AI를 구축하기 위해 협력하며, 데이터와 AI 모델을 큐레이팅하고 레이블을 지정하여 출처 및 소유권 세부 정보의 투명성을 보장합니다. 또한 모델과 데이터를 관리하고 지속적인 드리프트와 편향 문제를 해결합니다. 이 엄격한 접근 방식은 이 문서에서 논의된 데이터 소유권 및 개인정보 보호 문제를 효과적으로 완화합니다.

IBM은 오픈 소스 기업인 Hugging Face와 파트너십을 맺고 에코시스템을 구축했습니다. 두 회사 모두 watsonx 기능을 활용하여 기능성과 신뢰성을 기반으로 모델을 큐레이팅하고 보증하고 있습니다.

AI와 함께하는 미래

기업 내에서 ChatGPT와 같은 AI 챗봇을 직접 사용하면 보안, 데이터 유출, 기밀성, 책임, 지식 재산, 규정 준수, AI 개발 제한 및 개인정보 보호와 관련된 위험이 발생합니다. 이러한 위험은 조직에 평판 손상 및 비용이 많이 드는 법적 문제를 포함하여 부정적인 결과를 초래할 수 있습니다.

이러한 위험을 완화하고 신뢰할 수 있는 AI를 구축하기 위해 IBM watsonx가 권장 솔루션으로 대두되고 있습니다. 큐레이팅되고 레이블이 지정된 데이터와 AI 모델을 제공하여 소유권과 출처의 투명성을 보장하며, 편향 및 드리프트와 관련된 우려를 해결하여 추가적인 신뢰 계층을 제공합니다. IBM watsonx는 혁신과 책임감 있는 AI 사용 간의 균형을 유지합니다. 또한 IBM과 Hugging Face의 협력으로 모델 에코시스템을 강화합니다.

watsonx는 향상된 신뢰성과 엄격함을 제공하지만, 현재 ChatGPT 및 GPT 모델 제품군에서 볼 수 있는 광범위한 범용 용도에 필적할 수 있는 모델은 거의 없습니다. AI 모델 분야는 계속 발전하고 있으며 지속적인 개선을 기대할 수 있습니다. 최적의 결과를 얻으려면 모델을 평가하고 학습시키는 방법을 이해하는 것이 중요합니다. 이러한 지식을 바탕으로 정보에 입각한 의사 결정을 내리고 조직의 요구 사항과 품질 표준에 가장 적합한 모델을 선택할 수 있습니다.

조직은 watsonx를 채택함으로써 데이터에 대한 통제권을 유지하고 윤리적 및 법적 표준을 준수하면서 AI의 강력한 기능을 활용할 수 있습니다. 데이터를 보호하고 지식 재산을 보호하며 이해관계자와의 신뢰를 구축하는 동시에 큐레이팅된 모델과 향상된 투명성의 이점을 누릴 수 있습니다. 기업이 AI 영역을 탐색할 때 솔루션을 살펴보고 신뢰할 수 있는 AI에 우선순위를 두고 신중하게 진행하는 것이 중요합니다.

 
각주

때때로 IBM은 업계 전문가들을 초대하여 현재 기술 동향에 대한 의견과 인사이트를 공유합니다. 이 블로그 게시물의 의견은 자체 의견이며 반드시 IBM의 견해나 전략을 반영하는 것은 아닙니다.