Planejamento e otimização do índice do Db2 Text Search

As características da fonte de dados têm grande impacto no desempenho.

O tempo necessário para concluir uma atualização do índice de texto depende principalmente dos seguintes fatores:
  • o número de documentos a serem indexados
  • o tamanho do documento
  • o tipo de índice
  • paralelismo de atualização de índices
  • configuração do servidor de pesquisa de texto

O tempo de processamento de cada documento é a soma de um tempo fixo aproximado e de um tempo variável. O tempo fixo é influenciado pelo tipo de documento, como texto simples, XML ou INSO. O tempo fixo é aproximado porque pode haver pequenas variações no tempo para uso ou reutilização da memória. O tempo variável é determinado principalmente pelo tamanho do documento e pelas variações do processamento linguístico.

Para índices de documentos INSO, a manipulação de diferentes tipos de MIME também pode afetar o tempo de processamento.

O número de documentos que podem ser processados em um determinado período de tempo aumenta para tamanhos menores de documentos. No entanto, o rendimento total é menor para documentos menores do que para documentos maiores devido ao custo fixo por documento.