Planejando os requisitos de largura da banda da rede de áudio e vídeo

As conexões de vídeo são compartilhadas pelas redes e podem usar recursos de rede significativos. Este tópico explica como o vídeo do IBM Sametime usa a largura da banda e como calcular a quantia de largura da banda necessária para o ambiente.

O entendimento das necessidades de largura da banda de áudio e vídeo para a organização depende de dois fatores: Primeiro a simultaneidade, ou seja, o número de usuários que participam das conferências de vídeo ao mesmo tempo. Isso requer uma estimativa bem informada com base nos dados existentes da organização, como suposição, cultura de uso, padrão em tecnologia similar ou programas piloto. Se a estimativa for muito alta, haverá uma largura da banda extra que elevará o custo. Por outro lado, se a estimativa for muito baixa, a qualidade de áudio e vídeo poderá não ser aceitável, e outros aplicativos em rede poderão sofrer devido ao estouro da capacidade de largura da banda. Essa parte da avaliação requer uma pesquisa com os usuários, uma coleta de métricas sobre o uso de vídeo ou uma outra forma de estimar a intensidade do uso do recurso de vídeo. O segundo fator é como a mídia é gerada e compactada. Cada sessão de comunicação envolve somente áudio ou áudio e vídeo, portanto, a largura da banda da rede necessária para um usuário é, basicamente, a taxa de bits total dos codecs que estão sendo usados na sessão. Os codecs de áudio, em geral, requerem taxas de bits mais baixas do que os codecs de vídeo, porque os dados de áudio têm um volume menor do que os dados de vídeo. A primeira etapa para determinar o custo da largura da banda de uma determinada sessão é saber quais codecs estão sendo usados.

O Sametime fornece 6 codecs de áudio [SAC (Siren-LPR Scalable), Siren-LPR , G.722.1C , G.722.1, G.729, G.711] e 3 codecs de vídeo (H.264-SVC , H.264 e H.263). Cada codec requer uma largura da banda da rede diferente para operar. Em um codec de vídeo, há vários atributos que afetam o tamanho da carga útil de dados e a taxa de bits. Por exemplo, nas resoluções de vídeo, as resoluções HD requerem uma largura da banda maior do que as resoluções SD.

O padrão do Sametime é SAC (Siren-LPR Scalable) para áudio e H.264-SVC para vídeo durante a negociação de sessão do SIP entre dois terminais do Sametime – cliente a cliente ou cliente ao Video MCU. No entanto, os terminais podem selecionar codecs de áudio diferentes do SAC (Siren-LPR Scalable) e H.264-SVC para estabelecer a chamada em um ambiente integrado com uma ponte de áudio/vídeo externa. Essa flexibilidade causa impacto na largura da banda e pode ser configurada e controlada a partir da ponte externa.

O Sametime fornece recursos para proteger a rede contra a saturação causada por pacotes de dados de áudio e vídeo, caso a simultaneidade de uso seja superior à esperada. Quando implementados, cada chamada de áudio e vídeo é monitorada para controlar o uso da largura da banda, com base na classe de usuários e nas políticas de localização. A chamada pode ser permitida, rejeitada ou modificada para atender à restrição de utilização da largura da banda imposta para áudio e vídeo.

As seções a seguir descrevem em detalhes o uso de codecs de áudio e vídeo do Sametime e o gerenciamento de largura da banda da rede.

Codecs de áudio

O Sametime usa o Siren-LPR Scalable (codec de áudio escalável) para comunicação de áudio. A largura da banda disponível é dividida entre todos os usuários na chamada. Mais largura da banda é alocada para o alto-falante ativo (aproximadamente 48 k) e menos para os alto-falantes de segundo plano (aproximadamente 10 k para cada).

A tabela a seguir lista os requisitos de largura da banda para cada um dos codecs de áudio suportados pelo Sametime.

Tabela 1. Codecs de áudio, taxas de bits e taxas de amostragem do Sametime
Nome do codec Taxa de bits (kbps) Taxa de amostragem (kHz)
SAC (Siren-LPR Escaláveis) 32/ 48/ 64 48
Siren-LPR 24/ 32/ 48/ 64 48
G.722.1C 24/ 32/ 48 32
G.722.1 16/24/32 16
G.729 (somente usado no SUT) 8 8
G.711 64 8

Codecs de vídeo

O Sametime usa o H264- SVC, para aprimorar a videoconferência. Isso implica o uso de camadas ao enviar vídeo. Um cliente com capacidade menor solicitará somente as camadas de qualidade inferior e em menor número, enquanto um cliente com capacidade maior receberá várias camadas que serão combinadas para exibir um vídeo de qualidade superior. O benefício com relação às tecnologias anteriores é que o SVC apresenta uma degradação do vídeo mais agradável no caso de largura da banda baixa ou baixo uso de CPU. Como seu predecessor H.264/AVC, o SVC cobre uma ampla variedade de aplicativos, desde aplicativos móveis de baixa taxa de bits até a transmissão de televisão de alta definição (HDTV). Para obter mais informações sobre o SVC, consulte o RFC 6190.

A experiência de videoconferência é determinada pela taxa da linha do cliente. A taxa da linha do cliente é configurada pelo administrador, como parte da política do usuário. Alguns grupos de usuários podem ter diferentes políticas de vídeo que outros. A política tem a provisão para incluir modelos de conferência. Cada sala de conferência que pertence ao usuário é mapeada para um modelo de conferência na política de vídeo. O modelo especifica três configurações importantes: Modo de conferência, Experiência de conferência e Taxa da linha de conferência. Essas configurações, juntamente com a taxa da linha do cliente, determinam a experiência de vídeo geral de uma conferência.
  • Configuração padrão para taxa da linha do cliente -- 384 kbps
  • Configuração padrão para taxa da linha do cliente móvel -- 384 kbps
  • Configuração padrão para um modelo de conferência:
    • Modo de conferência - Mixed AVC+SVC
    • Experiência de conferência - Otimizada para dispositivos móveis
    • Taxa da linha de conferência - 384 kbps
A taxa da linha do cliente define a maior largura da banda que pode ser alocada para o cliente. A taxa da linha de conferência determina a largura da banda máxima permitida para qualquer usuário na chamada.
Nota: A taxa da linha de conferência não é a largura da banda agregada de todos os usuários na conferência, mas uma largura da banda por usuário.

Os clientes Sametime 8.5.2 usam o parâmetro de resolução de vídeo na política de vídeo para determinar a taxa máxima de bits, a taxa de quadros e a resolução de vídeo.

Dependendo do número de participantes na conferência, um cliente Sametime pode receber conexões de vídeo remotas de diferentes resoluções. A resolução de vídeo dessas conexões é decidida pela taxa da linha designada na política. Por exemplo, se houver dez participantes na conferência, um cliente poderá receber no máximo seis conexões de vídeo remotas. Com a taxa da linha de 1024 kbps, dois fluxos seriam de 180p a 30 fps, enquanto que quatro seriam de 180p a 15 fps.

Tabela 2. Número de conexões de vídeo remotas: 6
Taxa de Bits Resolução de downlink

1920 kbps

180p@30fps x 6

1024 kbps

180p@30fps x 2 +

180p@15fps x 4

768 kbps

180p@15fps x 4 +

180p@7.5fps x 2

512 kbps

180p@15fps x 5

384 kbps

180p@15fps x 1 +

180p@7.5fps x 2

256 kbps

180p@7.5fps x 2

Tabela 3. Número de conexões de vídeo remotas: 5
Taxa de Bits Resolução de downlink

1920 kbps

180p@30fps x 5

1024 kbps

180p@30fps x 4 +

180p@15fps x 1

768 kbps

180p@15fps x 5

512 kbps

180p@7.5fps x 5

384 kbps

180p@15fps x 1 +

180p@7.5fps x 2

256 kbps

180p@7.5fps x 2

Tabela 4. Número de conexões de vídeo remotas: 4
Taxa de Bits Resolução de downlink

1920 kbps

360p@30fps x 4

1024 kbps

180p@30fps x 4

768 kbps

360p@15fps x 1 +

180p@15fps x 3

512 kbps

180p@7.5fps x 4

384 kbps

180p@15fps x 1 +

180p@7.5fps x 2

256 kbps

180p@7.5fps x 2

Tabela 5. Número de conexões de vídeo remotas: 3
Taxa de Bits Resolução de downlink

1920 kbps

360p@30fps x 3

1024 kbps

360 p a 30 fps x 2+1

360p@15fps x 1

768 kbps

180p@30fps x 3

512 kbps

180p@15fps x 3

384 kbps

180p@15fps x 1 +

180p@7.5fps x 2

256 kbps

180p@7.5fps x 2

Tabela 6. Número de conexões de vídeo remotas: 2
Taxa de Bits Resolução de downlink

1920 kbps

360p@30fps x 2

1024 kbps

360p@30fps x 2

768 kbps

360p@30fps x 1 +

360p@15fps x 1

512 kbps

180p@30fps x 2

384 kbps

180p@15fps x 2

256 kbps

180p@7.5fps x 2

Tabela 7. Número de conexões de vídeo remotas: 1
Taxa de Bits Resolução de downlink

1920 kbps

720p@30fps x 1

1024 kbps

720p@30fps x 1

768 kbps

360p@30fps x 1

512 kbps

360p@30fps x 1

384 kbps

360p@30fps x 1

256 kbps

360p@30fps x 1

Tabela 8. Requisitos de resolução de vídeo e largura da banda para uplink a partir do cliente para o Video MCU. O cliente Sametime envia três camadas temporais (T0, T1 e T2) de 7,5, 15 e 30 quadros por segundo (fps) para cada uma das resoluções espaciais de 180 p, 360 p e 720 p. O requisito de largura da banda para cada camada temporal é listado na tabela a seguir.
Camada Temporal Resolução de 180p Resolução de 360p Resolução de 720p
Camada base, 7,5 fps 86 kbps 173 kbps 346 kbps
Primeira camada, 15 fps 128 kbps 256 kbps 512 kbps
Segunda camada, 30 fps 192 kbps 384 kbps 768 kbps

O cliente Sametime pode enviar várias camadas temporais de cada resolução com base na largura da banda disponível. A lista de resoluções de uplink para uma determinada largura da banda está na Tabela 9. Por exemplo, com 1024 kbps, um cliente pode enviar três conexões de 180 p a 30 fps, 360 p a 15 fps e 720 p a 15 fps. No entanto, para economizar largura da banda, o cliente somente enviará uma conexão se houver pelo menos um cliente remoto na conferência que a receberá. Portanto, se nenhum cliente remoto estiver recebendo os 720 p a 15 fps, eles não serão enviados. O cliente somente enviará as conexões de 180 p a 30 fps e 360 p a 15 fps.

Tabela 9. Resoluções de uplink por largura da banda
Taxa de Bits Resolução de downlink

1920 kbps

180p@30fps + 360p@30fps + 720p@30fps

1024 kbps

180p@30fps + 360p@15fps + 720p@15fps

768 kbps

180p@30fps + 360p@30fps

512 kbps

180p@30fps + 360p@15fps

384 kbps

180p@15fps + 270p@15fps

256 kbps

180p@30fps

128 kbps

180p@7.5fps

Neste exemplo, uma videoconferência consiste em 6 participantes: 2 participantes em dispositivos móveis, 2 participantes em laptops de nível médio e 2 participantes em laptops de alto nível com tela grande e processador potente.

Tabela 10. Métricas de consumo de largura da banda para cada tipo de usuário nesse exemplo
Dispositivo Resolução de vídeo a uma taxa de quadros (fps) vezes o número de usuários Possível número de vídeos remotos Largura da banda de downlink consumida por cliente (kbps) Largura da banda de uplink consumida por cliente (kbps)

Dispositivo móvel 1

180 p a 7,5 fps x 2

2

256

256

Dispositivo móvel 2

180 p a 15 fps x 1 + 180 p a 7,5 fps x 2

3

384

256

Desktop de nível médio 1

180 p a 7,5 fps x 5

5

512

256

Desktop de nível médio 2

180 p a 15 fps x 5

5

768

256

Desktop de alto nível 1

180 p a 30 fps x 4 + 180 p @ 15 fps x 1

5

1024

256

Desktop de alto nível 2

180 p a 30 fps x 5

5

1920

256

A largura da banda agregada consumida por essa conferência é 4864 kbps em downlink e 1536 kbps em uplink.

Gerenciamento de largura da banda

Modere todas as taxas de dados de áudio e vídeo para proteger a rede para outros aplicativos corporativos críticos e para fornecer largura da banda suficiente para uma qualidade visual e de voz aceitável.

O Sametime usa o SIP para negociar sessões de mídia. Integrada na mensagem do SIP está uma seção SDP (Session Description Protocol RFC 4566) contendo o atributo da largura da banda da sessão desejada, que o Bandwidth Manager usa para monitorar as taxas de transmissão na rede gerenciada.

O gráfico a seguir mostra o Bandwidth Manager implementado e parte do caminho de sinalização, executando CAC (Call Access Control) com base na largura da banda disponível.

Caminho de sinalização, terminal A e terminal B com o Bandwidth Manager executando o Call Access Control com base na largura da banda disponível.

Dependo da política do usuário, dos locais da chamada e da largura da banda disponível, o Bandwidth Manager pode aceitar a chamada, rejeitar a chamada ou modificar o atributo de mídia ou de largura da banda no SDP. A ação assegura que a taxa de transmissão total para áudio e vídeo não exceda a largura da banda disponível alocada para uso de áudio e vídeo na configuração do sistema.

As chamadas são registradas com detalhes, como os locais da chamada e a largura da banda necessária. As organizações podem usar essas informações para medir o uso de áudio e vídeo e a utilização da capacidade de rede para planejamento futuro. Use os dados capturados pelo Sametime Bandwidth Manager para calcular o impacto que a implementação de áudio e vídeo exerce na rede.

Existem diferenças no uso da largura da banda pelos codecs de áudio e vídeo devido à maneira que o Media Manager processa os dados no Sametime. O cálculo da largura da banda da rede necessária para uma organização deve ser baseado nas fórmulas fornecidas na Tabela 2 e na Tabela 4. Ele deve fazer parte do planejamento da capacidade para sustentar as melhores condições de rede possíveis para áudio e vídeo. As organizações devem considerar a implementação do Bandwidth Manager para proteger a rede e assegurar a qualidade das chamadas de áudio e vídeo. O uso dos dados capturados pelo Bandwidth Manager permite que a organização planeje sua capacidade futura.