Configurando reconhecimento de discurso para a API do Google Cloud Speech

Para a API do Google Cloud Speech, você pode alterar a configuração padrão da API RecognitionConfig. Por exemplo, você pode alternar a filtragem de profanidade, alterar o idioma ou incluir contexto de discurso. Você só precisa especificar qualquer configuração de API do Cloud Speech se quiser alterar o comportamento dos padrões de serviço.

Para alterar a configuração padrão, você pode definir

A criação de um arquivo JSON separado permite definir mais campos, em particular o contexto de discurso. Se um campo for definido em ambos os locais, o valor especificado no arquivo JSON terá precedência.

Configurando a API do Google Cloud Speech na configuração de implementação

Para configurar a API do Google Cloud Speech como parte da implementação do Adaptador Speech to Text, defina as variáveis de ambiente GOOGLE_SPEECH. Para obter uma lista completa de variáveis de ambiente de configuração, consulte Variáveis de ambiente do Adaptador Speech to Text.

Configurando a API do Google Cloud Speech em um arquivo JSON

  1. Crie um arquivo recognitionConfig.json e defina campos a partir da API RecognitionConfig no formato JSON. A pasta stt-adapter no repositório GitHub sample.voice.gateway contém um arquivo de amostra recognitionConfig.json que você pode usar para começar.

    Importante: os campos para a API RecognitionConfig devem ser especificados no formato de caixa alternante no arquivo recognitionConfig.json. Por exemplo, para o campo language_code, especifique languageCode.

    {
     "languageCode": "es-ES"
    }
    

    Nota: os campos do RecognitionConfig mostrados a seguir na API do Cloud Speech não podem ser modificados, pois possuem valores fixos que são usados pelo Speech To Text Adapter.

    • encoding
    • sample_rate_hertz
  2. Na configuração para o contêiner stt.adapter, monte o arquivo recognitionConfig.json em um volume e consulte o local do arquivo na variável de ambiente GOOGLE_SPEECH_RECOGNITION_CONFIG.

    Por exemplo, no Docker:

    stt.adapter:
     ...
     environment:
       - GOOGLE_APPLICATION_CREDENTIALS=/stt-adapter/credentials/google-service-account.json
       - GOOGLE_SPEECH_RECOGNITION_CONFIG=/stt-adapter/recognitionConfig.json
     volumes:
       - "/path/to/credentials/google-service-account.json:/stt-adapter/credentials/google-service-account.json"
       - "./recognitionConfig.json:/stt-adapter/recognitionConfig.json"
    

O Que Fazer em Seguida

Depois de alterar a configuração, reimplemente o Voice Gateway com o Adaptador Speech to Text para sua mudança entrar em vigor.