Antes de iniciar
Este tutorial é para desenvolvedores interessados em coletar e publicar documentos baseados em um formato XML padronizado. Neste caso, usamos o TEI P5 da Text Encoding Initiative, um formato amplamente usado por acadêmicos, arquivistas e bibliotecários no mundo todo para fins de arquivamento e pesquisa. Embora seja recomendável ter experiência prática com o Drupal, apresentamos conceitos fundamentais desse software e repassamos as etapas básicas da instalação. Portanto, a experiência com o Drupal não é essencial. Depois de concluir o tutorial, você terá aprendido a instalar o Drupal e a configurar os módulos Content Construction Kit (CCK) e XML Content para possibilitar vários tipos de conteúdo que podem atuar como entradas em XML, ser validados com relação ao esquema customizado e publicados de acordo com as especificações definidas nas folhas de estilo.
O site de amostra mencionado neste tutorial demonstra como publicar documentos que seguem rigorosamente as normas do XML customizado usando o sistema de gerenciamento de conteúdo Drupal.
Embora o Drupal não seja a única opção (nem mesmo a única opção grátis e de software livre) para implementar um sistema que permite a publicação de documentos TEI, é uma das plataformas mais usadas, executando milhares de sites no mundo todo — devido a isso, é maduro (bem testado) e bem suportado pela comunidade.
Já que o TEI P5 XML é um dos padrões publicados mais usados para fins acadêmicos, de arquivamento e de pesquisa, é o formato escolhido para este tutorial. Outros padrões XML com esquemas disponíveis, como o DocBook ou DITA XML, podem ser usados onde nós implementamos o TEI, desde que você faça as mudanças necessárias.
Entre os fatores que levam muitas pessoas (inclusive os autores) a escolher o TEI XML para fins de arquivamento e pesquisa, podemos citar a variedade de tipos de dados suportados pelas Diretrizes do TEI para Codificação e Troca de Textos Eletrônicos (ou seja, o padrão de marcação do TEI) e o desenvolvimento ativo e contínuo do padrão pela comunidade do TEI. Portanto, consideramos que a marcação do TEI é uma das melhores opções para descrever, exibir e reter documentos, oferecendo recursos de exibição potentes e flexíveis quando é usado em conjunto com as ferramentas de XML grátis e de software livre.
Drupal CMS—O Drupal está disponível gratuitamente e pode ser transferido por download em http://drupal.org/download. Este tutorial usa o Drupal versão 6.
Você precisa de um servidor ou host da Web com PHP instalado e acesso a um banco de dados para instalar o Drupal e disponibilizar o seu site ao público ao longo da Web. Usamos Apache e MySQL. Embora esteja fora do escopo desse tutorial abordar a seleção de um provedor de hospedagem na Web ou a instalação de um servidor da Web e banco de dados local, você verá que muitos hosts da Web baratos suportam a instalação do Drupal e fornecem acesso a bancos de dados como o MySQL ou o PostgreSQL.
Além do Drupal propriamente dito, você também precisa fazer o download de alguns módulos do software para possibilitar os recursos de publicação descritos no restante do tutorial:
- O módulo XML Content para possibilitar upload, cumprimento e orientação em relação aos recursos XML escolhidos pelo publicador do site.
- O módulo Content Construction Kit (CCK) para o Drupal para possibilitar tipos customizados de conteúdo do Drupal — nesse caso, a inclusão de um tipo de conteúdo XML definido pelo publicador do site.
- Também é conveniente escolher um tema do Drupal que permite alterar a aparência do site.
TEI Roma—O TEI Roma é uma ferramenta baseada na Web para gerar os esquemas XML customizados que o módulo de publicação descrito no tutorial usa para impor os padrões escolhidos pelo publicador do site.
Consulte Recursos para ver os links de download de todas as ferramentas.