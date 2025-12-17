데이터 파이프라인을 코드로 구축: IBM watsonx.data integration Python SDK 소개
데이터 팀이 파이프라인 개발을 확장하고 고품질 데이터로 에이전트를 강화할 수 있도록 지원하는, AI 지원 데이터 기반에 대한 IBM의 비전에서 중요한 이정표가 될 watsonx.data integration Python SDK의 정식 버전이 출시되었습니다.
데이터 팀이 파이프라인 개발을 확장하고 고품질 데이터로 에이전트를 강화할 수 있도록 지원하는, AI 지원 데이터 기반에 대한 IBM의 비전에서 중요한 이정표가 될 watsonx.data integration Python SDK의 정식 버전이 출시되었습니다.
watsonx.data integration Python SDK는 기존 Python 기술을 기반으로 하는 코드 우선 모델을 도입하여 에이전트에게 코드 생성 및 검증을 위한 일관된 인터페이스를 제공합니다. 데이터 팀이 에이전틱 AI를 준비할 때, 파이프라인 개발에는 LLM 생성에 적합한 또 다른 옵션이 있어야 합니다.
Python SDK는 팀이 배치 및 실시간 스트리밍 파이프라인을 코드로 구축, 버전 관리, 자동화 및 관리할 수 있도록 지원하여 수작업을 줄이고 확장 가능한 데이터 통합을 가능하게 함으로써 이러한 변화를 가능하게 합니다. 에이전트 파이프라인 작성에 대한 지속적인 투자(미리보기)와 함께, 이번 릴리즈는 AI 지원 데이터 기반을 구축하는 고객의 요구에 부응하기 위한 IBM의 노력을 공고히 합니다.
비즈니스 팀은 더 빠른 인사이트를 필요로 하고, 데이터 팀은 취약하고 파편화된 시스템으로 인해 업무가 가중되며, 규정 준수 책임자는 민감한 데이터가 유출될까 걱정하는 등 모든 조직이 오늘날의 데이터 환경에 부담을 느끼고 있습니다. 이러한 압박은 강력한 모델뿐 아니라 그 밑바탕에 있는 데이터 기반의 힘에 따라 성공 여부가 결정되는 에이전트 AI의 등장으로 더욱 심화되고 있습니다.
이러한 기반의 핵심에는 데이터를 연결, 변환, 전달하여 데이터를 신뢰하고 사용할 수 있도록 하는 파이프라인인 데이터 통합이 있습니다. 통합이 실패하면 AI도 실패합니다. MIT의 The GenAI Divide에 따르면 생성형 AI 파일럿의 95%가 실패하는 이유는 모델이 부족해서가 아니라 데이터 기반이 준비되지 않았기 때문입니다. 동시에 데이터 팀은 더 많은 데이터 유형과 환경에서 더 많은 파이프라인을 구축하고 관리해야 하는 과제를 안고 있지만, 조직의 77%는 필요한 기술이 부족하다고 응답했습니다.
이처럼 수요와 용량 간의 격차가 커지면서 파이프라인 개발은 사용자가 있는 곳에서 사용자를 충족할 수 있는 유연성을 갖춰야 한다는 것이 분명해졌습니다. 전통적인 작성 방식으로는 더 이상 충분하지 않습니다. 비즈니스 사용자는 자연어를 통해 의도를 표현하고 싶어합니다. 기술 실무자는 코드를 원합니다. 그리고 많은 팀이 신속한 설계를 위해 시각적 캔버스에 의존합니다.
IBM은 이러한 멀티모달 접근 방식에 깊이 투자하여 watsonx.data integration이 모든 사용자가 선호하는 워크플로를 지원할 수 있도록 하고 있습니다.
새로운 IBM watsonx.data integration Python SDK는 개발자와 데이터 엔지니어가 프로그래밍 방식으로 파이프라인을 구축, 자동화 및 유지 관리할 수 있는 강력한 코드 우선 방식을 제공함으로써 수작업을 줄이고 가치 실현 시간을 단축할 수 있도록 지원하므로 이러한 비전에서 중요한 진전을 이뤘습니다.
데이터 엔지니어와 ETL 개발자는 오랫동안 시각적 노코드/로코드 인터페이스 사용 또는 직접 코딩 등 데이터 파이프라인을 구축하는 방법을 선택할 수 있는 권한을 중요하게 생각해 왔습니다. 작성 스타일에 관계없이 파이프라인은 한 번 정의하고 Git에서 버전을 관리하며 CI/CD 워크플로를 통해 일관되게 배포할 수 있습니다. 각 접근 방식은 데이터 팀 내에서 서로 다른 요구 사항과 기술 세트를 제공합니다.
이제 팀은 Python SDK를 사용하여 데이터 엔지니어링에서 가장 널리 채택되는 언어 중 하나를 사용하여 데이터 통합 파이프라인을 작성하고 관리할 수 있습니다. 데이터 엔지니어는 Python 코드를 읽고, 쓰고, 검토하는 데 익숙하기 때문에 동일한 기술을 IBM watsonx.data integration에 적용할 수 있습니다. 코드로서의 파이프라인은 코드 재사용을 위한 새로운 길을 열어줍니다. 이 Python SDK를 제공함으로써 데이터 팀은 자신의 기술과 선호도에 맞는 다양한 작성 옵션 중에서 선택할 수 있습니다.
SDK를 통해 팀은 다음을 수행할 수 있습니다.
이러한 기능은 파이프라인이 소프트웨어처럼 작동하고, 자동화가 기본이며, 미래의 AI 에이전트가 데이터 흐름을 추론하고 최적화하며 대규모로 유지할 수 있는 데이터 통합의 다음 시대를 위한 토대를 마련합니다.
SDK는 파이프라인 개발에 프로그래밍 방식을 도입했지만, 그 영향은 팀이 일상적으로 적용하는 방식에서 가장 잘 드러납니다. 얼리어답터들은 더 빠르게 확장하고, 중복을 줄이며, 일관성 있게 운영하는 데 도움이 되는 일련의 공통 패턴에 집중하고 있습니다.
일반적인 출발점은 간단한 UI로 구축된 파이프라인입니다. CSV를 수집하고, 변환을 적용하고, 결과를 클라우드 스토리지에 기록하는 경우를 예로 들 수 있습니다. 수요가 증가함에 따라 다른 팀에서는 서로 다른 입력으로 동일한 로직을 원합니다.
Python SDK를 사용하면 새로운 Python 코드 생성 기능을 사용하여 원본 파이프라인을 Python으로 내보내고 재사용 가능한 매개변수화된 템플릿으로 전환할 수 있습니다. 새로운 매개변수 세트 및 값 세트 SDK 기능을 사용하면 이러한 구성을 UI에서 버전 관리로 이동할 수 있습니다. 양식에 값을 수동으로 입력하는 대신 개발, 테스트 및 프로덕션 환경에 대한 구성을 프로그래밍 방식으로 한 번에 정의하고 삽입할 수 있습니다. 파이프라인을 처음부터 다시 설계하지 않고 코드 몇 줄만 조정하여 변형을 만들 수 있으므로 배포 속도가 빨라지고 오류가 줄어들며 팀이 표준화할 수 있는 확장 가능한 패턴이 만들어집니다.
또 다른 일반적인 문제는 데이터베이스나 데이터 저장소를 마이그레이션하는 동안 많은 영향을 받는 데이터 소스나 환경으로 파이프라인을 업데이트해야 할 때 발생합니다. 팀은 UI에서 파이프라인을 업데이트하는 대신 SDK를 사용하여 프로그래밍 방식으로 흐름을 복제하고, 커넥터와 연결 구성을 업데이트하고, 매개변수를 조정하고, 몇 초 만에 업데이트를 게시할 수 있습니다. 이는 데이터 소스의 변화에 따라 파이프라인을 빠르게 발전시켜야 하는 환경에서 특히 유용합니다.
SDK는 퍼블릭 클라우드/SaaS 또는 자체 관리 소프트웨어 환경 등 하이브리드 환경에 안전하게 연결할 수 있습니다. 코드를 수십 번 수동으로 편집하는 대신 한 번의 코드 변경으로 모든 곳에 일관되게 적용할 수 있습니다.
이러한 패턴은 수동 구성에서 반복 가능한 소프트웨어 중심 개발로의 광범위한 전환을 의미합니다. 조직은 파이프라인을 코드로 처리함으로써 데이터 통합을 더 안정적으로 확장하고 에이전틱 AI에 필요한 강력한 데이터 기반을 구축할 수 있습니다.
watsonx.data integration Python SDK는 AI 지원 데이터 기반에 대한 IBM의 비전에서 중요한 이정표입니다. watsonx.data integration에 프로그래밍 자동화를 도입함으로써 팀은 소프트웨어 개발과 동일한 엄격함과 확장성으로 파이프라인을 구축하고 유지 관리하는 동시에 사용자가 선호하는 방식으로 데이터 엔지니어링 기술 격차를 해소하는 데 도움을 줄 수 있습니다.
광범위한 watsonx.data 포트폴리오의 일부인 watsonx.data integration은 신뢰할 수 있는 엔드투엔드 데이터 기반을 제공하기 위해 watsonx.data intelligence와 원활하게 작동합니다. 이러한 제품을 함께 사용하면 조직은 하이브리드 환경 전반에서 데이터를 이동, 이해, 관리, 활성화하여 AI 및 에이전틱 워크플로를 대규모로 강화할 수 있습니다.
IBM watsonx.data integration으로 파이프라인을 더 빠르게 구축하기