사례 연구 Cedat 85 Cedat 85
강력한 인지 기술을 기반으로 한 음성-텍스트 변환 솔루션을 통해 음성을 디지털 자산으로 전환
작은 건물을 배경으로 거리에서 대화하는 두 남자

억양, 방언, 언어, 목소리 등 다양한 정보를 자동 음성 인식을 사용해 디지털 자산으로 변환하는 것이 바로 음성에서 가치를 포착하는 솔루션을 개발하는 Cedat85의 사명입니다. Cedat85는 IBM® Power Systems AC922 서버를 사용하여 신경망 모델 학습을 가속화함으로써 솔루션 출시까지 소요되는 시간을 대폭 단축했습니다.

비즈니스 과제

음성에는 수많은 뉘앙스가 있기 때문에 이를 분석 가능한 텍스트로 변환하는 것은 기술적으로 매우 어려운 과제입니다. Cedat 85는 어떻게 음성 인식 기술의 선두 주자로서의 입지를 강화할 수 있었을까요?

혁신적 변화

Cedat 85는 IBM 가속 서버의 뛰어난 성능을 활용하여 신경망 모델의 학습 속도를 높임으로써 더 많은 프로젝트를 수행하고 더 빨리 결과를 제공할 수 있게 되었습니다.

결과 2.4배 빠른 속도
빠른 모델 학습으로 시장 출시 시간 단축 및 솔루션 정확도 향상
성장
새로운 프로젝트와 실험의 범위를 넓혀 매출 증대
일일 수십억 단어
대량의 단어를 인식하여 새로운 음성 인식 애플리케이션 개발 촉진
비즈니스 도전 스토리
음성의 비밀을 밝히다

인간은 수백, 수천 년 동안 복잡한 생각과 감정을 빠르고 효과적으로 전달하기 위해 음성 언어를 사용해 왔습니다. 그러나 음성만으로는 분석이 매우 어려우며 서면 기록이 필요하지만, 서면 기록 작업은 시간과 자원이 많이 소요됩니다.

음성 인식 기술은 음성을 분석 가능한 서면 텍스트로 자동 변환하여 음성을 서면으로 전환하는 작업을 개선하는 것을 목표로 합니다. 30년이 넘는 기간 동안 Cedat 85는 음성-텍스트 변환 솔루션 분야에서 획기적인 발전을 이루며 미디어, 정부, 금융 서비스, 보험, 기술, 마케팅 부서 및 컨택 센터의 고객들이 점점 더 복잡해지는 요구 사항을 충족할 수 있도록 지원해 왔습니다.

Cedat 85의 전무 이사인 Enrico Giannotti는 다음과 같이 설명합니다. "음성은 매우 정교하게 구성된 영역입니다. 우리는 다양한 언어, 방언, 언어 모델을 사용하여 말하고 있습니다. 매일 새로운 문구가 만들어지고 기존 단어의 의미가 바뀌는 등 음성은 매우 역동적입니다. 이 때문에 음성 인식 솔루션을 개발하는 것은 움직이는 과녁을 맞추는 것과 같다고도 할 수 있습니다."

2002년부터 Cedat 85는 음성-텍스트 변환 솔루션을 뒷받침하는 정교한 신경망을 구축해 왔으며, 시간이 지남에 따라 이에 대한 알고리즘은 더욱 복잡해지고 정확도가 향상되고 있습니다. Cedat 85는 개발의 다음 단계로 도약하기 위해 모델 학습 주기의 속도를 단축하고자 했습니다. 이전에는 인프라의 한계로 인해 신경망 모델을 학습하는 데 몇 주, 또는 몇 달까지도 걸릴 수 있었습니다. 학습이 완료될 때까지 모델의 정확도에 대한 인사이트가 거의 없거나 전혀 없었기 때문에 위험 부담이 크고 시간이 많이 소요되었습니다.

"Cedat 85는 방대한 양의 데이터를 사용하여 모델을 학습시킵니다."라고 Giannotti는 말합니다. “처리 속도를 높이기 위해 GPU로 인프라를 강화했지만 결과를 얻는 데는 여전히 오랜 시간이 걸렸습니다. 각 프로젝트마다 시간과 리소스가 너무 많이 투입되었기에 여러 기회를 뒤로 미뤄야만 했습니다. 분석 및 음성 지원 솔루션의 인기가 높아짐에 따라 음성-텍스트 변환과 관련된 새로운 시장이 계속 생겨나고 있습니다. 경쟁사에게 기회를 놓치지 않으려면 더 발 빠르게 움직여야 했습니다."

IBM Power Systems AC922 서버를 사용하면 신경망 모델을 2.4배 더 빠르게 학습시킬 수 있습니다. 그리고 중요한 것은 이러한 시간 절약이 정확성을 희생하는 대가로 발생하지 않는다는 것입니다. Enrico Giannotti 이사 Cedat 85
혁신 스토리
최신 혁신에 대한 소식 입수

Cedat 85는 엔터프라이즈 AI를 지원하도록 설계된 IBM Power Systems AC922 서버에 대해 알게 되었을 때, 해당 서버를 기존 GPU 가속 인프라와 비교할 수 있는 기회가 생겼다는 사실에 반가워했습니다.

Giannotti는 그 당시를 회상하며 다음과 같이 말합니다. "IBM이 최신 세대의 Power 시스템 서버를 통해 AI 워크로드에 대한 전례 없는 성능을 약속할 수 있는지 알아보고 싶었습니다. 이 기술을 테스트한 결과, 이전 환경보다 훨씬 뛰어난 성능을 발휘한다는 사실을 알게 되었습니다."

Cedat 85는 IBM 비즈니스 파트너인 Computer Gross Italia에 설치 지원을 요청했고, 며칠 만에 플랫폼이 가동되기 시작했습니다. 얼마 지나지 않아 Cedat 85는 'Save our Sounds'라는 획기적인 프로젝트의 입찰을 따내게 되었는데, 이는 영국의 소리 유산을 보존하기 위해 영국 국립 도서관에서 주도한 프로젝트였습니다. Cedat 85는 영국 전역의 방송국에서 녹음된 음성을 텍스트로 변환하여 과거와 미래의 라디오 방송에 대한 오디오 자본을 보존하는 국가 라디오 아카이브를 구축하는 데 참여하게 되었습니다.

"Save our Sounds는 Cedat 85에게 큰 이정표가 될 것입니다."라고 Giannotti는 말합니다. "이 프로젝트를 수행하려면 모델의 질을 높여야 했습니다. 예를 들어 모델이 영국에 존재하는 매우 다양한 억양과 방언을 인식하고 구어체 용어를 포착하게 만들어야 했습니다. 이러한 작업을 지원할 수 있는 새롭고 더욱 강력한 IBM 인프라가 적기에 도입되었습니다."

Cedat 85는 IBM 인프라의 지원을 받아 고객을 위해 매일 수십억 단어의 음성 텍스트를 생성하고 있습니다. 최신 IBM Power Systems 서버를 도입하여 음성-텍스트 변환 솔루션 개발 분야에서 계속 앞서 나갈 수 있게 되었습니다. Enrico Giannotti 이사 Cedat 85
결과 스토리
AI의 언어로 말하기

Cedat 85는 데이터 및 컴퓨팅 집약적인 IBM Power Systems 서버를 활용하여 고객에게 뛰어난 속도와 품질로 결과를 제공하고 있습니다. IBM 인프라는 솔루션 출시 일정을 단축하여 Cedat 85의 경쟁 우위를 확보하는 데 기여하고 있습니다.

"IBM Power Systems AC922 서버를 사용하면 신경망 모델을 2.4배 더 빠르게 학습시킬 수 있습니다."라고 Giannotti는 말합니다. "그리고 중요한 것은 이러한 시간 절약이 정확성을 희생하는 대가로 발생하지 않는다는 것입니다. 최근 한 정부 고객을 대상으로 파일럿 프로젝트를 진행했는데, 다양한 지역 억양과 방언을 수용할 수 있도록 모델을 조정해야 했습니다. 사용 사례에 적용했을 때 과거에는 몇 달이 걸렸을 영어 모델의 정확도를 몇 주 만에 거의 10%까지 높일 수 있었습니다. 이러한 개선의 성과는 AI 엔지니어의 전문성, 독점형 알고리즘, IBM 인프라의 초고속 처리 능력의 조합 덕분이라고 할 수 있습니다."

학습 시간이 짧아지면 엔지니어가 신경망 모델에 미세 조정이 필요한지 확인하기 위해 오래 기다릴 필요가 없으므로 Cedat 85의 위험 부담도 줄어듭니다. 또한 프로젝트 수행 역량을 강화하여 새로운 기회를 활용할 수도 있게 됩니다.

"IBM Power Systems AC922 서버를 구축한 덕분에 결함이 있는 모델을 한 번에 몇 달씩 훈련하느라 인프라를 묶어둘 걱정 없이 다양한 시도를 할 수 있어 더 많은 실험을 할 수 있게 되었습니다."라고 Giannotti는 설명합니다. "또한 기존 고객과 잠재 고객에게 보다 적극적으로 대응할 수 있어 매출 증대에 도움이 되고 아울러 몇 달 안에 IBM 솔루션에 대한 투자 수익을 얻을 수 있습니다."

미래를 전망하며 Cedat 85는 다른 IBM 기술을 자사 제품에 통합할 수 있는 방법을 모색하고 있습니다. 특히 IBM® Watson 툴을 통해 고객을 위해 텍스트에서 부가 가치를 창출할 수 있는 방법을 탐색하고 있습니다.

Giannetti는 다음과 같이 결론을 내립니다. “Cedat 85는 IBM 인프라의 지원을 받아 고객을 위해 매일 수십억 단어의 음성 텍스트를 생성하고 있습니다. 최신 IBM Power Systems 서버를 도입하여 음성-텍스트 변환 솔루션 개발 분야에서 계속 앞서 나갈 수 있게 되었습니다. 다음에는 IBM과 함께 더욱 특별한 솔루션을 시장에 선보일 수 있는 기회를 얻게 될 것으로 기대하고 있습니다."

Cedat 85

"IBM Power Systems AC922 서버를 사용하면 신경망 모델을 2.4배 더 빠르게 학습시킬 수 있습니다."라고 Giannotti는 말합니다. 전 세계 500개 이상의 고객사를 보유하고 있으며 33년간의 경험을 바탕으로 2018년 Gartner의 경쟁 환경에서 음성-텍스트 애플리케이션 부문 글로벌 상위 11개 기업 중 하나이자 유럽 상위 5개 기업 중 하나로 선정되었습니다. 국제적인 브랜드인 Speech-i를 통해 전 세계에서 사업을 운영하고 있습니다.

다음 단계 안내

IBM Power Systems에 대해 자세히 알아보려면 IBM 담당자나 IBM 비즈니스 파트너에게 문의하거나 ibm.com/power를 방문하세요.

더 많은 고객 사례 보기 또는 IBM 시스템 하드웨어에 대해 자세히 알아보기

Computer Gross Italia SpA에 대해 자세히 알아보려면 computergross.it(ibm.com 외부 링크) 사이트를 방문하세요.

각주

© Copyright IBM Corporation 2019. IBM Corporation, IBM Cloud, New Orchard Road, Armonk, NY 10504

2019년 8월 미국에서 제작.

IBM, IBM 로고, ibm.com 및 Power Systems는 전 세계 여러 국가에 등록된 International Business Machines Corp.의 상표입니다. 기타 제품 및 서비스 이름은 IBM 또는 다른 회사의 상표일 수 있습니다. 최신 IBM 상표 목록은 www.ibm.com/kr-ko/legal/copytrade.shtml의 '저작권 및 상표 정보'에서 확인하세요.

Linux는 미국 및/또는 기타 국가에서 사용되는 Linus Torvalds의 등록 상표입니다.

이 문서는 최초 발행일 기준 최신 문서로, IBM은 언제든지 해당 내용을 변경할 수 있습니다. IBM이 현재 영업 중인 모든 국가에서 모든 제품이 제공되는 것은 아닙니다.

명시된 성능 데이터 및 고객 사례는 오직 정보 목적으로 제공됩니다. 실제 성능 결과는 특정 구성 및 작동 조건에 따라 다를 수 있습니다. 본 문서의 정보는 상품성, 특정 목적에의 적합성, 비침해성 보증 또는 조건을 포함하여 명시적 또는 묵시적 보증 없이 '있는 그대로' 제공됩니다. 제품 제공 시의 계약 조건에 따라 해당 IBM 제품을 보증합니다.

고객은 관련 법률 및 규정을 준수할 책임이 있습니다. IBM은 법률 자문을 제공하지 않으며, 자사의 서비스 또는 제품이 고객의 법률 또는 규정 준수 여부를 보장함을 나타내거나 보증하지 않습니다.