Visão Geral (Comando MATRIX DATA)

O MATRIX DATA lê materiais de matriz brutos e os converte em um arquivo de dados de matriz que pode ser lido por procedimentos que manipulam materiais de matriz. Os dados podem incluir estatísticas vetoriais, como médias e desvios padrão, bem como matrizes.

MATRIX DATA é semelhante a um comando DATA LIST : ele define nomes de variáveis e sua ordem em um arquivo de dados brutos. No entanto, o MATRIX DATA pode ler somente dados que estão em conformidade com o formato geral de arquivos de dados de matriz.

Arquivos de Matriz

Como os arquivos de dados de matriz criados por procedimentos, o arquivo que o MATRIX DATA cria contém as seguintes variáveis na ordem indicada. Se as variáveis estiverem em uma ordem diferente no arquivo de dados brutos, o MATRIX DATA as reorganiza no conjunto de dados ativo.

  • Variáveis de arquivo dividido. Essas variáveis opcionais definem arquivos divididos. Pode haver até oito variáveis de divisão e elas devem ter valores numéricos. As variáveis de arquivo dividido aparecerão na ordem em que são especificadas no subcomando SPLIT .
  • ROWTYPE_. Esta é uma variável de sequência com o formato A8 . Seus valores definem o tipo de dados para cada registro.. Por exemplo, ele pode identificar uma linha de valores como médias, desvios padrão ou coeficientes de correlação Cada arquivo de dados de matriz possui uma variável ROWTYPE_ .
  • Variáveis de fator. Pode haver qualquer número de fatores. Eles ocorrem apenas se os dados incluírem informações dentro das células, como as médias dentro das células. Os fatores possuem o valor omisso do sistema nos registros que definem as informações agrupadas. Variáveis de fator aparecem na ordem em que são especificadas no subcomando FACTORS .
  • VARNAME_. Esta é uma variável de cadeia com o formato A8 . MATRIX DATA gera automaticamente VARNAME_ e seus valores com base nas variáveis nomeadas em VARIABLES. Nunca insira valores para VARNAME_. Os valores para VARNAME_ estão em branco para registros que definem informações do vetor. Cada matriz no programa possui uma variável VARNAME_
  • Variáveis contínuas. Essas são as variáveis usadas para gerar os coeficientes de correlação ou outros dados agregados. Pode haver qualquer número deles. Variáveis contínuas aparecem na ordem em que são especificadas em VARIABLES.

Opções

Arquivos de Dados É possível definir dados sequenciais e dados em um arquivo externo.

Importante: os dados sequenciais são limitados a 1024 bytes por linha; quaisquer dados além desse limite serão truncados. Considere mover os dados sequenciais para um arquivo externo e usar MATRIX DATA FILE=<path/file> para evitar qualquer possível perda de dados..

Formato de Dados.. Por padrão, os dados são considerados inseridos no formato de campo livre com cada vetor ou linha começando em um novo registro (a palavra-chave LIST no subcomando FORMAT ). Se cada vetor ou linha não começar em um novo registro, use a palavra-chave FREE Também é possível usar FORMAT para indicar se as matrizes são inseridas no formato triangular superior ou inferior ou quadrado completo ou retangular e se elas incluem ou não valores diagonais.

Tipos de variáveis. É possível especificar variáveis de divisão de arquivo e fator usando os subcomandos SPLIT e FACTORS . É possível identificar tipos de registro especificando ROWTYPE_ no subcomando VARIABLES se os valores ROWTYPE_ forem incluídos nos dados ou implicando os valores ROWTYPE_ em CONTENTS.

Especificação básica

A especificação básica é VARIABLES e uma lista de variáveis.. Especificações adicionais são necessárias conforme a seguir:

  • O FILE é necessário para especificar o arquivo de dados se os dados não estiverem sequenciais
  • Se os dados estiverem em qualquer formato diferente de triangular inferior com valores diagonais incluídos, FORMAT será necessário..
  • Se os dados contiverem valores além de coeficientes de matriz, como a média e o desvio padrão, a variável ROWTYPE_ deverá ser especificada em VARIABLES e os valores ROWTYPE_ deverão ser incluídos nos dados ou CONTENTS deverá ser usado para descrever os dados.
  • Se os dados incluírem variáveis de divisão de arquivo, SPLIT será necessário Se houver fatores, FACTORS será necessário..

As especificações na maioria dos subcomandos MATRIX DATA dependem se ROWTYPE_ está incluído nos dados e especificado em VARIABLES ou se está implícito usando CONTENTS.

Tabela 1. Requisitos de subcomando em relação a ROWTYPE_
Subcomando ROWTYPE_ implícito usando CONTENTS ROWTYPE_ explícito em VARIÁVEIS
FILE O padrão é INLINE O padrão é INLINE
VARIABLES Necessário Necessário
FORMAT O padrão é LOWER DIAG O padrão é LOWER DIAG
SPLIT Necessário se arquivos divididos* Necessário se arquivos divididos
FACTORS Necessário se os fatores Necessário se os fatores
CELLS Necessário se os fatores Não aplicável
CONTENTS O padrão é CORR Opcional
N Opcional Opcional

* Se os dados não contiverem valores para as variáveis de divisão de arquivo, esse subcomando poderá especificar uma única variável, que não é especificada no subcomando VARIABLES

Ordem de Subcomando..

  • SPLIT e FACTORS, quando usados, devem seguir VARIABLES
  • Os subcomandos restantes podem ser especificados em qualquer ordem..

Regras de sintaxe

  • Nenhum comando pode ser especificado entre MATRIX DATA e BEGIN DATA, nem mesmo um comando VARIABLE LABELS ou FORMAT . As transformações de dados não podem ser usadas até que o MATRIX DATA seja executado