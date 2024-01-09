생성형 AI의 등장으로 몇몇 유명 기업들은 민감한 내부 데이터를 잘못 취급할 수 있다는 이유로 사용을 제한하고 있습니다. CNN에 따르면 일부 기업은 기술을 더 잘 이해하기 위해 생성형 AI 도구에 대한 내부 금지 조치를 취했으며, 많은 기업이 내부 ChatGPT의 사용을 차단하기도 했습니다.

기업은 여전히 대규모 언어 모델(LLM)을 탐색할 때 내부 데이터를 사용하는 위험을 감수하는 경우가 많은데, 이는 이러한 상황별 데이터를 통해 LLM이 범용 지식에서 도메인별 지식으로 전환될 수 있기 때문입니다. 생성형 AI 또는 전통적인 AI 개발 주기에서 데이터 수집이 진입점 역할을 합니다. 여기에서 회사의 요구 사항에 맞는 원시 데이터를 수집, 전처리, 마스킹 및 LLM 또는 기타 모델에 적합한 형식으로 변환할 수 있습니다. 현재 데이터 수집의 문제를 극복하기 위한 표준화된 프로세스는 없지만 모델의 정확도는 데이터 수집에 따라 달라집니다.