Jak działa usługa Watson Speech to Text?

Usługa Speech to Text oferuje interfejs API, dzięki któremu aplikacje zyskują funkcje transkrypcji mowy. Wykorzystuje ona informacje o strukturze języka i sygnału dźwiękowego.

Cechy i elementy usługi Watson Speech to Text

Zaawansowane rozpoznawanie mowy w czasie rzeczywistym

Możesz korzystać z automatycznej transkrypcji wypowiedzi w 7 językach, która jest przeprowadzana w czasie rzeczywistym. Rozwiązanie błyskawicznie identyfikuje temat rozmów i dokonuje ich transkrypcji nawet w wypadku nagrań o niskiej jakości. Obsługuje przy tym różne formaty plików audio i interfejsy programistyczne (HTTP REST, Websocket, Asynchronous HTTP).

Bardzo precyzyjny mechanizm przetwarzania mowy

Wykorzystywany model można dostroić, by działał dokładniej w wypadku najważniejszych języków i treści, takich jak nazwy produktów, drażliwe tematy lub imiona i nazwiska konkretnych osób. Rozwiązanie pozwala z dużą pewnością i dokładnością rozpoznawać w plikach dźwiękowych różnych mówców i konkretne słowa kluczowe.

Różne zastosowania

Możesz dokonywać transkrypcji plików audio w różnych celach — od spisywania w czasie rzeczywistym słów wypowiadanych do mikrofonu po analizowanie tysięcy nagrań z centrum zgłoszeniowego w celu przeprowadzenia wartościowej analizy.

Wystarczy kilka minut, by zacząć korzystać z usługi Watson Speech to Text

Zacznij pracę z usługą Watson Speech to Text