Configurando reconhecimento de discurso para a API do Google Cloud Speech

Para a API do Google Cloud Speech, você pode alterar a configuração padrão da API RecognitionConfig. Por exemplo, você pode alternar a filtragem de profanidade, alterar o idioma ou incluir contexto de discurso. Você só precisa especificar qualquer configuração de API do Cloud Speech se quiser alterar o comportamento dos padrões de serviço.

Para alterar a configuração padrão, você pode definir

Como variáveis de ambiente do Docker, diretamente na configuração de implementação
Como propriedades JSON em um arquivo JSON separado

A criação de um arquivo JSON separado permite definir mais campos, em particular o contexto de discurso. Se um campo for definido em ambos os locais, o valor especificado no arquivo JSON terá precedência.

Configurando a API do Google Cloud Speech na configuração de implementação

Para configurar a API do Google Cloud Speech como parte da implementação do Adaptador Speech to Text, defina as variáveis de ambiente GOOGLE_SPEECH. Para obter uma lista completa de variáveis de ambiente de configuração, consulte Variáveis de ambiente do Adaptador Speech to Text.

Configurando a API do Google Cloud Speech em um arquivo JSON

Crie um arquivo recognitionConfig.json e defina campos a partir da API RecognitionConfig no formato JSON. A pasta stt-adapter no repositório GitHub sample.voice.gateway contém um arquivo de amostra recognitionConfig.json que você pode usar para começar.

Importante: os campos para a API RecognitionConfig devem ser especificados no formato de caixa alternante no arquivo recognitionConfig.json. Por exemplo, para o campo language_code, especifique languageCode.
```
{
 "languageCode": "es-ES"
}
```
Nota: os campos do RecognitionConfig mostrados a seguir na API do Cloud Speech não podem ser modificados, pois possuem valores fixos que são usados pelo Speech To Text Adapter.
- encoding
- sample_rate_hertz

Na configuração para o contêiner stt.adapter, monte o arquivo recognitionConfig.json em um volume e consulte o local do arquivo na variável de ambiente GOOGLE_SPEECH_RECOGNITION_CONFIG.

Por exemplo, no Docker:

stt.adapter:
 ...
 environment:
   - GOOGLE_APPLICATION_CREDENTIALS=/stt-adapter/credentials/google-service-account.json
   - GOOGLE_SPEECH_RECOGNITION_CONFIG=/stt-adapter/recognitionConfig.json
 volumes:
   - "/path/to/credentials/google-service-account.json:/stt-adapter/credentials/google-service-account.json"
   - "./recognitionConfig.json:/stt-adapter/recognitionConfig.json"

O Que Fazer em Seguida

Depois de alterar a configuração, reimplemente o Voice Gateway com o Adaptador Speech to Text para sua mudança entrar em vigor.