Planejamento e otimização do índice do Db2 Text Search
As características da fonte de dados têm grande impacto no desempenho.
- o número de documentos a serem indexados
- o tamanho do documento
- o tipo de índice
- paralelismo de atualização de índices
- configuração do servidor de pesquisa de texto
O tempo de processamento de cada documento é a soma de um tempo fixo aproximado e de um tempo variável. O tempo fixo é influenciado pelo tipo de documento, como texto simples, XML ou INSO. O tempo fixo é aproximado porque pode haver pequenas variações no tempo para uso ou reutilização da memória. O tempo variável é determinado principalmente pelo tamanho do documento e pelas variações do processamento linguístico.
Para índices de documentos INSO, a manipulação de diferentes tipos de MIME também pode afetar o tempo de processamento.
O número de documentos que podem ser processados em um determinado período de tempo aumenta para tamanhos menores de documentos. No entanto, o rendimento total é menor para documentos menores do que para documentos maiores devido ao custo fixo por documento.