Glossário

Os termos e definições a seguir se aplicam ao IBM® Netezza® Replication Services.

lista não processada: Uma estatística que mede a quantidade de dados, em bytes, que deve ser replicada e aplicada na réplica para que ela se torne consistente com a primária. A quantidade de dados é a diferença entre o número de bytes que foram processados pelo commit mais recente na réplica e o número de bytes que foram processados no primário. O backlog indica a carga de trabalho do gerenciador de fila de replicação na fila.
replicação por SQL: Um método de replicação no qual instruções SQL idênticas são executadas em relação a dados idênticos em todos os servidores de banco de dados em um conjunto de replicação, de modo que todos os resultados sejam idênticos. Como os comandos SQL, e não o efeito líquido dos comandos, são replicados e os comandos geralmente contêm muito menos dados do que o efeito líquido, a replicação de comandos SQL oferece um desempenho mais alto do que a replicação por valor. IBM Netezza Replication Services é implementado principalmente usando a replicação por SQL. Para garantir a consistência primária e de réplica, no entanto, o IBM Netezza Replication Services usa a replicação por valor para as instâncias em que uma instrução SQL contém ou resulta em dados não determinísticos, um nó é marcado como "precisa de recuperação" ou uma variável de sessão é definida para replicar por valor. Consulte também replicação por valor, determinística.
replicação por valor: Um método de replicação no qual o efeito líquido das instruções SQL de atualização é capturado no nível da linha e replicado para todos os servidores de banco de dados em um conjunto de replicação. O software de replicação avalia as declarações somente no primário e, em seguida, captura e reproduz o efeito líquido nas réplicas. Como o efeito líquido é conhecido, a replicação pode suportar diferenças de host que fazem com que a execução do SQL produza resultados diferentes nos dois hosts. Devido às grandes quantidades de dados que estão sendo replicados, a replicação por valor normalmente tem um desempenho inferior ao da replicação por SQL. IBM Netezza Replication Services é implementado principalmente usando a replicação por SQL, recorrendo à replicação por valor mais lenta quando os dados replicados são modificados usando funções não determinísticas. Consulte também replicação by-SQL, determinística.
replicação de dados de alteração: Consulte replicação por valor.
grupo: Uma coleção de sistemas completos que trabalham juntos para fornecer um recurso de computação unificado. Para a replicação, a configuração de alta disponibilidade requer gerenciadores de fila de replicação em uma configuração em cluster com software de cluster para gerenciar os servidores como um serviço altamente disponível.
identificador de sequência de confirmação: Ver CSI.
número de sequência do commit: Consulte CSN.
transações simultâneas: Transações em que nenhum dos participantes se compromete antes do início da outra. Os comandos ou consultas de transações simultâneas podem não ter sido executados ao mesmo tempo.
CSI: Um par <source-id, CSN>, em que source-id identifica o nó principal (que pode mudar com o tempo) que originou a transação de atualização específica e CSN é um identificador de confirmação. Consulte também CSN.
CSN: Um número crescente que é atribuído a cada transação replicada no momento do commit. A ordem de confirmação das transações replicadas no primário define a ordem em que as transações são reexecutadas (ou aplicadas) em um host de réplica. É possível usar o CSN, que aparece em várias exibições e registros de replicação, para rastrear transações confirmadas. O CSN é um ID de confirmação exclusivo em todos os nós do conjunto de replicação; se um nó trocar de função, o CSN aumentará a cada nova confirmação.
Linguagem de Controle de Dados: Consulte DCL.
Linguagem de definição de dados: Consulte DDL.
Linguagem de manipulação de dados: Consulte DML.
DECL: Um conjunto de comandos com os quais um usuário pode gerenciar um banco de dados ou sistema.
DDL: Uma linguagem para descrever dados e suas relações em um banco de dados. Consulte também DML.
determinista: Uma consulta determinística sempre produz os mesmos resultados quando executada em cada host em um conjunto de replicação. Uma consulta não determinística pode produzir resultados diferentes. As funções matemáticas geralmente são determinísticas: por exemplo, 1 + 1 resulta em 2 a cada execução. RANDOM é um exemplo de uma função não determinística; ela produz um valor imprevisível todas as vezes. IBM Netezza Replication Services detecta e lida com SQL de atualização não determinística usando replicação por valor. Todos os outros SQL são tratados usando a replicação por SQL. Consulte também replicação por valor.
recuperação de desastre: Uma situação em que a perda permanente de dados ou funcionalidade devido à falha de hardware ou software em seu ambiente operacional é minimizada. Em caso de falhas múltiplas, é possível haver perda de dados. Consulte também RPO.
Dispositivo de bloco replicado distribuído: Consulte DRBD.
DML: Um subconjunto de instruções SQL que é utilizado para manipular dados. SELECT, INSERT, UPDATE, DELETE e MERGE são instruções DML.
DRBD: Um sistema de armazenamento replicado distribuído baseado em software para sistemas Linux® que usa espelhamento para formar clusters de alta disponibilidade (HA). A replicação pode usar o DRBD em configurações de alta disponibilidade para espelhar os dados do sistema de arquivos entre os hosts de HA.
eventualmente consistente: Um tipo de modelo de replicação no qual um sistema pode ficar para trás em relação a outro, de modo que uma alteração X iniciada no primário no momento T1 será seguida em um momento futuro, T2, nas réplicas. Latência é a diferença de tempo entre T2 e T1. Consulte também consistente de forma síncrona, latência.
dados globais: Privilégios para usuários e grupos, níveis de segurança, categorias, coortes e dados globais (não relacionados a objetos). Os dados globais são replicados para todos os hosts membros em um conjunto de replicação, com alterações propagadas em instruções SQL (da mesma forma que para dados de usuário replicados).
alta disponibilidade: Ver HA.
HA: Um sistema ou componente que está continuamente ou quase continuamente operacional. Em uma configuração continuamente disponível, ambos os hosts estão ativos; em uma configuração quase contínua, como uma que usa IBM Netezza Replication Services, um host está ativo e o outro é passivo. Ambas as configurações de HA eliminam um único ponto de falha, adicionando redundância ao sistema e detecção e reparo de falhas à medida que elas ocorrem.
host: O sistema Linux no qual o software Netezza é executado.
Rede Local: Para o IBM Netezza Replication Services, qualquer rede com um tempo de ping de ida e volta insignificante. A latência da rede é insignificante se a janela TCP/IP não precisar ser ajustada para usar totalmente a largura de banda da rede.
latência: Uma estatística que mede a quantidade de tempo que uma réplica está atrasada em relação à primária: o delta entre a hora do commit mais recente na réplica e a hora em que o commit foi processado na primária.
balanceamento de carga: Um processo de distribuição uniforme do trabalho em vários servidores para maximizar o desempenho da consulta. Os usuários são responsáveis por atribuir trabalho a diferentes instâncias Netezza NPS no conjunto de replicação para alcançar o equilíbrio de carga.
Rede Área Local (LAN): Ver LAN.
servidor de log: Consulte gerenciador de filas de replicação.
primária: O host em um conjunto de replicação que é a única fonte de alterações nos bancos de dados replicados e nos dados globais. Outros hosts no conjunto de replicação são réplicas. Um administrador pode alterar a função de host primário de um host para outro, normalmente em resposta a falhas e interrupções planejadas ou para "seguir o sol" entre fusos horários. Veja também a réplica.
Instância do NPS Netezza: O servidor de banco de dados em um nó de replicação. Uma instância Netezza NPS em um conjunto de replicação assume uma função primária (que permite que os clientes emitam consultas de atualização para os bancos de dados replicados e dados globais) ou uma função de réplica (que permite apenas consultas de seleção, não consultas de atualização). Consulte também o gerenciador de filas de replicação.
largura da banda da rede: O volume de dados que uma conexão de rede pode transmitir. Por exemplo, a Ethernet de 100 megabits tem uma largura de banda de aproximadamente 10 megabytes por segundo, a Ethernet de gigabits suporta 100 megabytes por segundo e a Ethernet de 10 gigabits (10 GbE ) suporta 1.000 megabytes por segundo. Normalmente, uma LAN tem uma latência curta e atinge facilmente a largura de banda total da rede. Em uma WAN, geralmente é necessário ajustar a janela TCP/IP para manter altas taxas de transmissão de dados.
registro de log de qualificação: Um registro no log de replicação que está disponível para poda. A disponibilidade é determinada pelos filtros que são definidos pelas variáveis do sistema ( MAX_LOG_AGE e replPruneRetainCSN ). Os registros qualificados incluem arquivos de confirmação e suas dependências que têm CSNs mais antigos do que o ponto de poda determinado.
EXIG: RQM refere-se ao software de serviços de replicação.
Software RQM: O software IBM Netezza Replication Services, que deve ser executado no gerenciador de fila de replicação física ou virtual, e não no host NPS®. O software gerencia a conexão de rede e a comunicação entre as instâncias IBM Netezza NPS.
Partição de dados RQM: O volume de disco local no gerenciador de fila de replicação que é reservado para o log de replicação. O log de replicação deve ser configurado em um volume reservado, separado do sistema operacional e dos volumes de instalação do RQM, para garantir a operação estável do sistema durante um evento de "log cheio". Se esse log estivesse em uma partição compartilhada comum com o sistema operacional e outros softwares, um evento de "log cheio" poderia travar todo o sistema em vez de simplesmente interromper a replicação.
objetivo do ponto de recuperação: Consulte RPO.
Objetivo do tempo de recuperação: Consulte RTO.
relaxamento (ou relaxamento) da serialização: Consulte isolamento de snapshot.
banco de dados replicado: Um banco de dados Netezza que é replicado entre os hosts em um conjunto de replicação. Você cria um banco de dados replicado ao adicionar um banco de dados criado a um conjunto de replicação.
Transação Replicada: Qualquer transação de atualização que modifique um banco de dados replicado ou dados globais. Consulte também transação de atualização.
registro de replicação: A transação replicada SQL e outros dados que são capturados no host de replicação principal e armazenados pelo gerenciador de fila de replicação para reprodução nos hosts de replicação de réplica. O registro de replicação é armazenado como uma coleção de arquivos na partição de dados RQM do servidor de registro de replicação.
gerenciador de fila de replicação: O gerenciador de fila de replicação e o software PTS que, juntos, descarregam o processamento do registro de replicação da instância Netezza NPS. O servidor de log primário armazena o log de replicação em um disco local e o transfere pela rede para os hosts do servidor de log dos nós de replicação de réplica.
nó de replicação: A combinação de uma instância Netezza NPS (o nó NPS) e um gerenciador de fila de replicação.
Conjunto de replicação: Uma coleção de nós de replicação que replicam um ou mais bancos de dados replicados e dados globais. Todos os objetos de usuário (por exemplo, tabelas, exibições e sinônimos) em um banco de dados replicado e seus privilégios e conteúdos associados são replicados para todos os nós membros em um conjunto de replicação. Os hosts em um conjunto de replicação devem ter a maioria, se não todos, os parâmetros de configuração definidos de forma idêntica. Consulte também nó de replicação.
recuperar: Para restaurar dados que foram alterados por uma instrução SQL para o estado em seu último ponto de confirmação.
tabela com segurança de linha: Uma tabela de banco de dados com rótulos de segurança nas linhas para filtrar usuários sem os privilégios adequados.
RPO: A perda de dados que pode ser tolerada, geralmente expressa como um intervalo de tempo, para um site inteiro (instância do NPS e host do gerenciador de fila de replicação). Por exemplo, você pode definir o RPO como "não superior a uma hora" Se o primário cair às 2:00 p.m. e a replicação falha na réplica, dados de 1:00 p.m m. e anteriores devem "eventualmente" estar disponíveis na réplica. Dados entre 1:00 p.m m. e 2:00 p.m m. é a perda de dados tolerada. Um RPO de zero significa que a única perda tolerada são as últimas transações não comprometidas.
RTO: O tempo para recuperar o conjunto de replicação dentro do objetivo do ponto de recuperação (RPO) e promover um novo primário para que novas transações de atualização replicadas possam ser executadas. Suponha que a replicação falhe na réplica às 14:00 p.m. Se levar 15 minutos para os dados primários antes das 13:00 p.m. para terminar de ser replicado e aplicado na réplica, a réplica pode ser promovida a primária às p.m. e começar a processar novas transações. O RTO, neste exemplo, é de 15 minutos.
Rede de Área de Armazenamento: Ver SAN.
SAN (storage area network): Uma rede dedicada de dispositivos de armazenamento que conecta esses dispositivos a servidores para fornecer armazenamento compartilhado em nível de bloco. Em uma SAN, os dispositivos aparecem para o sistema operacional como conectados localmente.
Selecionar consulta: Qualquer transação que selecione dados de tabelas não temporárias (sem modificá-las) ou que atualize tabelas temporárias no nó de replicação primário ou de réplica (mas somente para a transação atual, pois as tabelas não têm escopo de sessão). As consultas Select não são replicadas.
serializável: Uma execução dos comandos do banco de dados de uma coleção de transações é considerada serializável se seu efeito for equivalente à execução das transações que foram confirmadas e de nenhum comando das transações que não foram confirmadas, uma de cada vez até a conclusão (ou seja, confirmação da transação) em alguma ordem serial.
isolamento serializável: Um DBMS fornece isolamento serializável se impuser a execução serializável de transações (para as transações que escolhem ou têm como padrão o isolamento serializável). Uma implementação de isolamento serializável geralmente oferece menos simultaneidade e menor taxa de transferência do que a de um nível de isolamento mais fraco. Consulte também isolamento de snapshot.
sequência: Um objeto de banco de dados que é independente de qualquer tabela e que gera automaticamente valores de chave exclusivos com base nas especificações iniciais do usuário.
isolamento de instantâneos: Um DBMS oferece isolamento de instantâneo se cada transação executada sob esse nível de isolamento visualizar um "instantâneo" consistente do banco de dados que reflita apenas as transações que foram confirmadas quando a transação específica foi iniciada e se as atualizações ou exclusões da mesma linha por transações simultâneas não forem permitidas. (Alguns DBMSs impõem essa última propriedade no momento do commit da transação; Netezza a impõe quando a instrução de atualização ou exclusão simultânea é executada) Netezza suporta o isolamento de snapshot para aplicativos que exigem maior simultaneidade do que o isolamento serializável permite e estão dispostos a trocar a aplicação de restrições de consistência entre linhas. O isolamento de instantâneo é suportado para transações replicadas com o IBM Netezza Replication Services 1.5 e posterior. Consulte também isolamento serializável.
Replicação de instruções SQL: Consulte replicação por SQL.
matriz de armazenamento: Um conjunto de um ou mais gabinetes de disco que contêm os bancos de dados e tabelas de usuários no sistema Netezza. A matriz de armazenamento está conectada a um chassi de SPU e pertence a ele.
réplica: Uma função em um conjunto de replicação em que é proibida a execução de transações de atualização em tabelas ou sequências não temporárias em um banco de dados replicado. Há suporte total para atualizações temporárias de tabelas e seleções persistentes de tabelas. Um conjunto de replicação pode ter um primário, que um administrador pode reatribuir, e uma ou mais réplicas. Um host de replicação de réplicas pode executar transações de consulta para balanceamento de carga, incluindo a criação e a atualização de tabelas temporárias com escopo de transação. Veja também primário.
consistente de forma síncrona: Um modelo de replicação no qual uma determinada consulta emitida no mesmo banco de dados em diferentes servidores de banco de dados em um conjunto de replicação sempre retorna resultados idênticos. É necessário que os diferentes bancos de dados garantam que todas as transações de atualização sejam aplicadas a todos os servidores no conjunto de replicação antes que os resultados sejam visíveis em qualquer servidor. Garantir esse nível de consistência exige uma penalidade de desempenho que geralmente é proibitiva em uma WAN. Veja também eventualmente consistente.
Janela TCP/IP: Um parâmetro de configuração do kernel do Linux usado para ajustar o software de rede TCP/IP de modo que ele utilize totalmente a largura de banda da rede em uma rede de longa distância (WAN).
tabela temporária: Uma tabela que é privada para uma sessão e que o DBMS destrói automaticamente ao final de uma sessão ou transação.
transação: Um grupo de operações de banco de dados que são combinadas em uma unidade lógica de trabalho que é totalmente confirmada ou revertida.
aplicativo de transação/apply: A reexecução em um nó de réplica de uma transação de atualização replicada que se originou em um nó primário.
bifurcação da transação: Um estado de replicação de erro que resulta quando várias primárias em um conjunto de replicação executam diferentes transações de atualização, começando em uma transação raiz comum. IBM Netezza Replication Services geralmente evita a ocorrência de bifurcações de transações ao impor um único primário ativo por vez. No entanto, em determinadas circunstâncias (como um erro de rede), as tarefas de recuperação podem resultar em uma bifurcação de transação, que suspende o nó local. Você deve resolver a bifurcação em todos os nós para garantir um conjunto consistente de dados de registro antes de reativar a replicação.
Nível de isolamento de transação: Uma descrição das restrições à execução de uma transação, concomitantemente com outras transações. O padrão ISO SQL define quatro níveis de isolamento: leitura não confirmada, leitura confirmada, leitura repetível e serializável. Outros níveis de isolamento úteis que não estão no padrão foram definidos e implementados: em particular, o isolamento de instantâneos, que é mais forte do que a leitura repetível, mas não tão forte quanto o isolamento serializável. Os DBMSs individuais geralmente não suportam todos os níveis de isolamento. Netezza suporta apenas o isolamento serializável (o nível de isolamento padrão) e o isolamento de snapshot. Consulte também isolamento de snapshot.
transação de atualização: Qualquer transação que crie, exclua ou modifique dados não temporários. Esse termo abrange não apenas as instruções UPDATE, mas também DELETE, INSERT, CTAS (Create Table As Select), CREATE, ALTER, DROP, GRANT e REVOKE. As consultas (como SELECT) não são replicadas. As transações de atualização podem ser aplicadas a tabelas temporárias, mas essas tabelas têm apenas escopo de sessão e são descartadas no final da transação.
exibição: Uma visualização pode ser uma tabela virtual ou uma consulta armazenada. Os dados que podem ser acessados por meio de uma visualização não são armazenados no banco de dados como um objeto distinto, mas como uma instrução SELECT. O conjunto de resultados do comando SELECT forma a tabela virtual que é retornada pela visualização.
máquina virtual: Ver VM.
Máquina Virtual: No que se refere à replicação, um servidor virtual na nuvem que fornece a funcionalidade de gerenciador de fila de replicação.
Rede de longa distância: Consulte WAN.
WAN: Para o IBM Netezza Replication Services, qualquer rede com uma latência de ida e volta que seja grande o suficiente para retardar a transferência de dados. Se a latência for grande o suficiente para retardar a transferência de dados, a janela TCP/IP poderá ser ampliada para aumentar a taxa de transferência. Os servidores de registro de replicação são conectados por uma WAN.
largura de banda limitada por janela: O tamanho da janela TCP/IP dividido pela latência da rede, que indica o pico de desempenho alcançável em uma determinada configuração de WAN para uma determinada janela TCP/IP. Por exemplo, uma conexão de 1 GbE (com suporte para até aproximadamente 100 MB/s) com latência de 100 ms em uma janela padrão de 128 KB tem uma largura de banda limitada por janela de 1280 KB/s 1.2 MB/s). A mesma conexão com uma janela de 10 MB tem uma largura de banda limitada por janela de 100 MB/s.