O propósito deste documento é fornecer uma boa prática para configurar Procura Aprimorada, bem como para criar e fazer manutenção do índice de procura.
Este documento aplica-se ao IBM Cognos Software Versão 10.1 em todas as plataformas e pode também ser aplicado a releases subsequentes. Os serviços a seguir são os componentes da Procura Aprimorada.
Os seguintes serviços são os componentes da Procura Aprimorada.
O Serviço de Procura de Índice trata de solicitações de procura e drill-through (procura de contexto), comunica-se com o Serviço de Dados de Índice para recuperar os resultados para procuras de texto completas.
Um ambiente IBM Cognos pode incluir múltiplas instâncias do Serviço de Procura de Índice.
Serviço de Atualização de Índice
O Serviço de Atualização de Índice fornece as principais funções de crawl de conteúdo. Coletará dados para indexação e transmitirá essas informações ao Serviço de Dados do Índice para armazenamento.
Um ambiente IBM Cognos pode incluir múltiplas instâncias do serviço de atualização de índice. Porém, para iniciar com uma única instância deve ser deve ser configurado.
O Serviço de Dado do Índice fornece funções básicas de texto completo para armazenamento e recuperação dos termos e documentos de resumo indexado. Porém, para iniciar com uma única instância deve ser deve ser configurado.
Recomendamos que você instale o serviço de dado do índice na camada de dados. Execute o Serviço de Dado do Índice sob um usuário que tenha acesso exclusivo tanto ao processo de serviço quanto aos arquivos do índice.
Os componentes de Procura Aprimorada (serviço de dado do índice, serviço de atualização de dados e serviço de procura de índice) são implementados sob um despachante com todos os serviços da camada de aplicativo de uma instalação do IBM Cognos.
Essa é a instalação e configuração padrão da Procura Aprimorada IBM Cognos e é útil para uma prova da instalação do conceito. Em um ambiente de produção, pode-se desejar configurar uma instalação distribuída. Para desempenho adicional, a Procura Aprimorada pode ser hospedada em um servidor dedicado no qual apenas os serviços de procura estejam ativados.
O serviço de atualização de índice e o serviço de dado do índice podem consumir grandes quantidades de memória quando está executando, e recomenda-se que sejam instalados como instalações separadas. Em um ambiente de 32 bits, 1,5 GB de memória deve estar disponível por instância.
Os componentes da Procura Aprimorada IBM Cognos são distribuídos usando o mesmo método de instalação e configuração usado para componentes IBM Cognos distribuídos. Execute a instalação em cada computador e depois conclua a configuração especificando o local dos componentes IBM Cognos distribuídos e ativando e desativando os serviços necessários.
Cada ambiente IBM Cognos pode ter múltiplos serviços de dados de índice, múltiplos serviços de atualização de índice e múltiplos arquivos de índice. Inicialmente, um único Serviço de Dado do Índice e Atualização de Índice deve estar ativado. Para melhorar a segurança, recomendamos instalar o serviço de dado do índice na camada de dados.
Para mais informações sobre a configuração do sistema, consulte a seção “Ativando e desativando serviços de índice em uma instalação distribuída” no Guia de Instalação e Configuração.
Intervalo de verificação do processo do despachante
Devido à carga nos Serviços de Relatório de Lote, maior validação dos processos deve ser ativada dentro dos despachantes que executam os Serviços de Relatório de Lote.
Edite o seguinte arquivo>:
<install>/webapps/p2pd/WEB-INF/p2pd_deploy_defaults.properties
Adicionando a linha:
processCheckInterval=30000
Conexões de serviço de atualização de índice
Como atualizações adicionam e excluem entradas, apenas uma Tarefa de Atualização de Índice deve ser executada por vez. Ter a uma instância recomendada em execução e apenas uma conexão evitará que múltiplas tarefas de indexação sejam executadas ao mesmo tempo. Ativação, Administração do IBM Cognos Na guia Configuration, escolha Dispatcher and Services. Para a instância em execução do Serviço de Atualização do Índice, defina o número máximo de conexões para horas de pico e fora de pico para 1. Consulte “Definir o número máximo de processos e conexões” no Guia de Administração e Segurança.
Configurações de TCP/IP para todos os servidores de indexação
A operação dos vários serviços de procura sob a plataforma tem um impacto significativo sobre o consumo de recursos de comunicação. No Microsoft Windows, é crucial atualizar “TcpTimedWaitDelay” para um valor mínimo de 0x1E, que define o tempo de espera para 30 segundos, e “MaxUserPort” para pelo menos um valor de 32768 decimais. Consulte a documentação relevante para seu sistema operacional.
Etapas recomendadas para criar um índice de procura eficaz.
- Refine o escopo do índice
- Defina os idiomas de indexação
- Crie o índice inicial
- Atualize o índice
- Inclua os dados de relatório no seu índice
Por tipo de conteúdo
Embora as configurações de parâmetro padrão para Procura Aprimorada permitiriam aos administradores construir um índice inicial, é boa prática verificar que todos os tipos de conteúdo são necessários para um ambiente em particular ou cumprir os requisitos de regulamentos de negócio. É possível excluir todas as instâncias de um tipo de conteúdo específico de atualizações de índice. Ativação, Administração do IBM Cognos Na guia Index Search, clique em Index e depois em General. Sob Indexable Types, desmarque os objetos a serem excluídos do índice. Para o índice inicial, pode ser bom excluir “output” da primeira passagem de indexação se já tiver um grande número de saídas de relatório.
Por local do conteúdo
Para evitar expor objetos não voltados para o usuário típico, pode-se desejar restringir os seguintes tipos de conteúdo: conteúdo não usado/arquivado, conteúdo de pré-produção ou conteúdo especializado, como relatórios do sistema.
Ao criar uma Tarefa de Atualização de Índice, pode ser possível adicionar uma lista de pastas para excluir do índice. Na seção Excluded Content, clique em Add. Selecione os pacotes e as pastas a serem excluídos da Tarefa de Atualização de Índice.
Defina os idiomas de indexação
Se seu armazenamento de conteúdo ou dados for multilíngue, deve-se definir os idiomas de indexação antes de criar o primeiro índice.
Ativação da Administração do IBM Cognos. Na guia Index Search, clique em Index e depois em General. Sob Indexing Locales, insira uma lista de idiomas separada por vírgula (p. ex., fr, ja).
Observação: variantes de país para um idioma não são suportadas (p. ex., en-us), apenas o idioma deve ser usado.
Recomenda-se que o índice de procura seja construído com uma conta que tenha acesso a todo o conteúdo nas Pastas Públicas, de modo que todo o conteúdo estará disponível aos usuários.
Observação: Independentemente das permissões do usuário que constrói o índice, por padrão os resultados da procura mostrarão apenas conteúdo ao qual o usuário realizando a procura tem acesso. Consulte “Secure Search Results” no Guia de Administração e Segurança.
Para ajudar a garantir que a construção do índice inicial tenha impacto limitado sobre os usuários, a prática comum é programar o processo de construção do primeiro índice para ocorrer durante períodos de baixo uso de relatório.
Criar uma nova Tarefa de Atualização de Índice (consulte “Criar uma Tarefa de Atualização de Índice” no Guia de Administração e Segurança) por padrão, todo o conteúdo de Pastas Públicas é incluído e deve-se excluir o conteúdo selecionado que não se deseja que seja indexado (consulte Refinando o escopo “Por Local do Conteúdo”).
É possível escolher executar o índice inicial agora ou em uma data posterior. Para a primeira execução, recomenda-se não definir uma programação de repetição para essa tarefa de indexação.
Selecione executar a Index Update Task, para as Content Options, selecione apenas “Properties and metadata”, e para Scope, selecione “All entries”. Pressione “Run” para iniciar a indexação do conteúdo.
| Opção | Descrição |
|---|---|
| Propriedades e metadados | As propriedades e os metadados de objetos dentro do conteúdo incluído (pasta) da tarefa de indexação são indexados. Objetos relacionados (p. ex., saída de relatório) também são indexados. Tipos de conteúdo não selecionados como "Indexable Types" serão ignorados. |
| Apenas entradas que mudaram | Atualiza o índice existente. Conteúdo inalterado será retido no índice. |
| Todas as entradas | Reconstrói todo o índice. Todo o conteúdo anteriormente indexado será excluído. |
O índice não é atualizado automaticamente quando o conteúdo muda, como quando um relatório é criado ou quando um objeto é removido do Gerenciador de Conteúdo. É preciso atualizar o índice para capturar todas as mudanças.
Com base nas expectativas dos seus usuários, você desejará programar a sua Tarefa de Atualização de Índice para atualizar de maneira incremental os conteúdos do índice. Isso pode ser após algumas horas, toda noite, ou mesmo semanalmente, dependendo da frequência com que seu conteúdo muda.
Retorne à Tarefa de Atualização de Índice inicial criada e programe a tarefa para executar ao intervalo desejado (consulte “Gerenciamento de Programação” no Guia de Administração e Segurança). Para as Content Options, selecione apenas “Properties and metadata”, e para Scope, selecione “Only entries that have changed”. Uma atualização incremental do índice levará menos tempo e usará menos recursos que a criação do índice inicial.
Observação: Múltiplas Tarefas de Atualização de Índice não devem estar executando ao mesmo tempo. Uma vez que a indexação incremental pode adicionar e excluir entradas, múltiplas tarefas de execução que podem levar a entradas duplicadas ou faltando. Se houver apenas uma instância em execução do Serviço de Atualização de Índice, múltiplas tarefas ficarão na fila até que a tarefa em execução seja concluída.
Inclua dados de relatório no índice
Incluir dados de relatório no seu índice melhorará a precisão dos resultados da procura, aprimorará os relatórios gerados para “Create and Explore”, bem como fornecerá relacionamentos de metadados com dados em resultados de procura. Por exemplo, uma procura para “Canada” também retornaria relatórios incluindo os metadados País e Região de Vendas, mesmo se o termo Canadá não estivesse no momento em nenhuma das saídas de relatório.
AO indexar dados, duas opções estão disponíveis.
| Opção | Descrição |
|---|---|
| Dados de referência | Especifica que apenas dados referidos pelas expressões encontradas em relatórios, consultas e análise que estão incluídos no escopo da tarefa de indexação são indexados. Objetos de modelo no conteúdo selecionado são ignorados. |
| Todos os dados | Especifica que todos os dados encontrados nos modelos que estão no escopo da tarefa de indexação são indexados. Independentemente de se os metadados foram incluídos no relatório, consulta ou análise. |
Indexar Todos os dados consome a maioria dos recursos e leva uma quantidade de tempo considerável até a conclusão, não sendo recomendado para grandes armazéns de dados.
Recomenda-se criar múltiplas Tarefas de Atualização de Índice para pacotes e pastas relacionados. Uma programação deve ser criada para cada Tarefa de Atualização de Índice que atenda os requisitos de negócio, bem como com que frequência os dados são atualizados. Por exemplo, um PowerCube precisaria de indexação apenas após a atualização, enquanto um banco de dados relacional pode precisar de indexação a uma frequência mais regular.
Indexando dados referidos
Criar uma nova Tarefa de Atualização de Índice inclui pastas que contêm relatórios, consultas ou análise para as quais se deseja coletar dados referidos. Sob “Content Options” desmarque “Properties and metadata” e selecione “Data values”, certificando-se de que “Referenced data” esteja selecionado. Sob “Scope”, selecione “Only entries that have changed” (mesmo para a primeira vez em que executar a Tarefa de Atualização de Índice).
Indexando todos os dados
Criar uma nova Tarefa de Atualização de Dados, inclua os pacotes para os quais deseja coletar todos os dados.Sob “Content Options” desmarque “Properties and metadata” e selecione “Data values”, certificando-se de que “All data” esteja selecionado. Sob “Scope”, selecione “Only entries that have changed” (mesmo para a primeira vez em que executar a Tarefa de Atualização de Índice).
Observação: Quando os dados são coletados, todos os dados anteriores para o pacote são atualizados no índice.
Excluindo conjuntos de dados
Ao indexar dados, pode-se desejar excluir da indexação certos itens, dimensões ou hierarquias da consulta do pacote. Seja por questões de desempenho, se eles forem muito grandes e contenham conteúdo de pouco valor (p. ex., números telefônicos), ou por motivos de segurança.
Ativação, Administração do IBM Cognos Na guia Index Search,clique em Index e depois em Exclusion. Insira os valores para o nome do pacote que contêm os metadados, o tipo a excluir (p. ex., hierarquia ou dimensão) e o caminho para o tipo de objeto no modelo.
Recomenda-se fazer backup do índice que é armazenado no sistema de arquivos, por padrão, esse diretório é <installDir>/indexes/csn. Isso deve ser feito como um mínimo após longas atualizações de índice. O índice pode ser restaurado de volta ao seu local original, desde que não haja nenhuma Tarefa de Atualização de Índice em execução no momento. Não é necessário reiniciar o servidor após restaurar o índice.
A indexação coloca uma carga significativa sobre a operação do Serviço de Relatório de Lote para recuperar tanto metadados quanto dados. O desempenho desse serviço tem um impacto significativo sobre a indexação.
Durante a indexação, dados detalhados de desempenho são gerados, no forma de arquivos “stat_<date>.html” gerados no diretório de log. Essas informações podem ser usadas para determinar quanto tempo é gasto nos vários serviços de Procura versus o tempo gasto no Serviço de Relatório de Lote. Por fim, múltiplas instâncias do Serviço de Relatório de Lote podem precisar ser implementadas para um desempenho ideal.
Para gerenciar as necessidades de indexação adicionais, planeje e escale os Serviços de Relatório de Lote adequadamente.
O número total de conexões de alta afinidade disponíveis para indexação deve ser igual ao número de CPUs disponíveis nos servidores que hospedam o serviço de atualização de índice.
É possível definir o parâmetro de configuração avançada, CSN.Indexing.Level, para controlar a CPU e o uso da memória de uma tarefa de indexação e, portanto, gerenciar o impacto que a tarefa de indexação tem sobre os recursos disponíveis. Se um servidor for dedicado a executar o Serviço de Atualização de Indexação, então o valor deve ser definido como alto.
Acesse Index Search, Index, página Advanced e defina o parâmetro avançado para um dos seguintes valores (padrão é normal).
| Configuração | Descrição |
|---|---|
| alta | 1,5 encadeamento de indexação por processador disponível. Recomendado para servidores que são dedicados à indexação. |
| médio | 1 encadeamento de indexação por processador disponível. Recomendado quando nenhum outro aplicativo está em execução no mesmo servidor. |
| baixa | 0,5 encadeamento de indexação por processador disponível. Recomendado quando baixo uso do sistema é necessário. |
Observação: Se você selecionar “high” precisará garantir que haja conexões de alta afinidade suficientes disponíveis nos Serviços de Relatório de Lote.
Para escalar operações de procura e indexação, é possível implementar múltiplas instâncias do serviço de dados de índice para diferentes servidores. Porque a procura é ligada à CPU, é possível obter balanceamento de carga introduzindo novos servidores que compartilhem o mesmo índice. Essa configuração é conhecida como compartilhamento de indexação.
O compartilhamento de índice permite que múltiplos serviços de dados de índice procurem e atualizem um único índice localizado no sistema de arquivo compartilhado dentro do ambiente IBM Cognos BI distribuído. Todos os serviços de dados de índice podem procurar todos os arquivos de índice.
Para mais informações sobre Compartilhamento de Índice, consulte “Scaling Index Search by Using Index Sharing” no Guia de Instalação e Configuração do IBM Cognos.
A Procura Aprimorada fornece uma amostra de arquivo IPF chamado ipfcsnclientconfig.xml (localizado na pasta de configuração), que, por padrão, produz alguma criação de log básica. Criação de log extra pode ser ativada configurando os níveis de criação de log dentro do arquivo para "debug". Renomeie o arquivo para ipfclientconfig.xml para ativar a criação de log. Não é necessário reiniciar o servidor. Três arquivos de log são gerados.
- csn.log - arquivo de criação de log principal
- csnSearchSummary.log - resumo das solicitações de procura
- csnIndexing.log - informações de detalhadas para conteúdo de indexação.
Mais leitura
Guia de Administração e Segurança, Capítulo 30: Gerenciando a Procura de Índice
Guia de Instalação e Configuração, Capítulo 11: Opções de configuração, Configurando a Procura de Índice do Configuring IBM Cognos
Guia do Usuário, Capítulo 3: Conexão do IBM Cognos, Procura por uma Entrada