Recomendado, 2024

Escolha Do Editor

Diferença entre a tabela de fatos e a tabela de dimensão

A tabela de fatos e a tabela de dimensões são os fatores essenciais para criar um esquema . O registro de uma tabela de fatos é uma combinação de atributos de diferentes tabelas de dimensões. A tabela de fatos ajuda o usuário a analisar as dimensões de negócios que o ajudam na tomada de decisões para melhorar seus negócios. Por outro lado, as tabelas de dimensões ajudam a tabela de fatos a coletar dimensões ao longo das quais as medidas devem ser tomadas.

O ponto que distingue a tabela Fact e a tabela Dimensão é que a tabela de dimensões contém atributos ao longo dos quais as medidas são tomadas na tabela de fatos . Existem alguns outros fatores que criam diferenças entre a Tabela de Fatos e a Tabela de Dimensão para visualizá-los, vamos dar uma olhada no gráfico de comparação mostrado abaixo.

Gráfico de comparação

Base para ComparaçãoTabela de fatosTabela de dimensões
BasicA tabela de fatos contém a medida ao longo dos atributos de uma tabela de dimensões.A tabela de dimensões contém os atributos ao longo dos quais a tabela de fatos calcula a métrica.
Atributo e RegistrosA tabela de fatos contém menos atributos e mais registros.A tabela de dimensões contém mais atributos e menos registros.
Tamanho da tabelaTabela de fatos cresce verticalmente.A tabela de dimensões cresce horizontalmente.
ChaveA tabela de fatos contém uma chave primária que é uma concatenação de chaves primárias de todas as tabelas de dimensões.Cada tabela de dimensões contém sua chave primária.
CriaçãoA tabela de fatos só pode ser criada quando as tabelas de dimensões são concluídas.Tabelas de dimensões precisam ser criadas primeiro.
EsquemaUm esquema contém menos número de tabelas de fatos.Um esquema contém mais número de tabelas de dimensões.
AtributosA tabela de fatos pode ter dados em formato numérico e textual.A tabela de dimensões contém sempre atributos em formato textual.

Definição da tabela de fatos

Uma tabela de fatos é uma tabela que contém medidas ao longo dos atributos das tabelas de dimensão. Pode conter as informações no nível mais baixo possível. Algumas tabelas de fatos contêm apenas dados de resumo, chamados de Tabela de fatos agregados . A tabela de fatos contém quase a data carimbada . Vamos discutir as características de uma tabela de fatos.

Chave Concatenada
A tabela de fatos contém uma chave concatenada que é a concatenação de chaves primárias de todas as tabelas de dimensão. A chave concatenada da tabela de fatos deve identificar exclusivamente a linha em uma tabela de fatos.

Grão de Dados
Grão de dados mostra o quão profunda as medições na tabela de fatos foram armazenadas. Grão de dados deve estar no nível mais alto possível.

Medidas Aditivas
Atributos da tabela de fatos podem ser totalmente aditivos ou semi-aditivos . Medidas totalmente aditivas são aquelas que podem ser facilmente resumidas para todas as dimensões da tabela de fato. Por exemplo, quantity_ordered, é um atributo que pode ser resumido para todas as dimensões. Por exemplo, podemos eliminar quantity_order total para um determinado cliente, região, data, marca, etc. As medidas semi-aditivas são aquelas que podem ser somadas em algumas dimensões da tabela de fatos, mas não em todas as dimensões. Como, o valor do saldo não pode ser resumido ao longo do tempo, uma vez que muda ao longo do tempo.

Dados esparsos
Às vezes, podemos ver os registros na tabela de fatos que tem atributos com medidas nulas . Por exemplo, pode não haver nenhum pedido em um feriado. Portanto, os atributos para essa data terão medidas nulas. Não temos que armazenar medidas para esse tipo de registro, pois ele não fornece nenhuma informação.

Dimensões degeneradas
Às vezes você pode encontrar algumas dimensões na tabela de fatos, que não são nada aditivas. Por exemplo, order_number, customer_id, você não pode adicionar esses tipos de dimensões. No entanto, no caso, você precisa encontrar um pedido feito por um determinado cliente neste mês; então você precisará do customer_id para relacionar sua pesquisa. Esses tipos, se atributos ou dimensões da tabela de fatos, são chamados de Dimensão Degenerada .

Definição da Tabela de Dimensão

A Tabela de dimensões é um componente-chave para o Esquema inicial. Uma tabela de dimensões contém os atributos que representam as dimensões, ao longo dos quais a medida é obtida na tabela de fatos. Além disso, discutiremos algumas características de uma tabela de dimensões.

Atributos e Chaves
Cada tabela de dimensão deve ter uma chave primária que identifique exclusivamente cada registro da tabela. É comum observar que a tabela de dimensões contém muitos atributos. Por isso, parece ser grande, ou seja, quando você cria uma tabela de dimensões, ela se espalha horizontalmente .

Valores de atributo
Os valores dos atributos na tabela de dimensões raramente são numéricos, na maioria das vezes você encontrará os valores nos atributos em formato textual . Por exemplo, nome do produto, marca, categoria, subcategoria, etc.

Relação entre Atributos
Com frequência você pode observar que os atributos encontrados em uma tabela de dimensões não estão diretamente relacionados. Como, Product_brand não precisa fazer nada com o package_date, mas ainda assim ambos podem ser os atributos da tabela de dimensões Product.

Normalização
A tabela de dimensões não deve ser normalizada . Isso ocorre porque normalizar uma tabela criaria muitas tabelas intermediárias. Quando uma consulta seleciona um atributo da tabela de dimensões e recupera as medidas ao longo da tabela de fatos, a consulta precisa passar por essas tabelas intermediárias que se tornam ineficientes. Portanto, as tabelas de dimensões não são normalizadas.

Perfurando, enrolando
Atributos da tabela de dimensões permitem obter os detalhes, seja percorrendo de um nível mais alto de atributos agregados para atributos de nível inferior. Por exemplo, se você deseja encontrar a venda total em uma região, pode pesquisar as vendas por estado, cidade e CEP. Você pode até mesmo acumular as vendas totais primeiro pelo zip, depois pela cidade e depois pelo estado.

Hierarquia Múltipla
Muitas vezes, a tabela de dimensões oferece várias hierarquias. Por exemplo, temos uma tabela de dimensões do produto para uma loja de departamentos. Agora, temos dois departamentos de marketing e departamento de contabilidade.

O departamento de marketing detalhará os atributos da tabela de dimensões do produto em uma determinada hierarquia para obter medidas para a tabela de fatos.

Em outras mãos, o departamento de contabilidade detalhará os atributos da tabela de dimensões do produto na hierarquia diferente para obter medidas para a tabela de fatos.

Portanto, a tabela de dimensões deve ter várias hierarquias ou nível de agregação de atributos para permitir que o usuário faça uma pesquisa detalhada em várias hierarquias.

Registros
Embora uma tabela de dimensões tenha muitos atributos, ela tem menos registros.

Principais diferenças entre a tabela de fatos e a tabela de dimensão

  1. A tabela de fatos contém medidas ao longo da dimensão / atributos de uma tabela de dimensões.
  2. A tabela de fatos contém mais registros e menos atributos em comparação à tabela de dimensões, enquanto a tabela de dimensões contém mais atributos e menos registros.
  3. O tamanho da tabela da tabela de fatos cresce verticalmente, enquanto o tamanho da tabela da tabela de dimensão cresce horizontalmente.
  4. Cada tabela de dimensões contém uma chave primária para identificar cada registro na tabela, enquanto a tabela de fatos contém a chave concatenada, que é uma combinação de todas as chaves primárias de todas as tabelas de dimensões.
  5. A tabela de dimensões deve ser registrada antes da criação da tabela de fatos.
  6. Um Esquema contém menos tabelas de fatos, mas mais tabelas de dimensão.
  7. Os atributos da tabela de fatos são tanto numéricos quanto textuais, mas os atributos da tabela de dimensões têm apenas atributos textuais.

Conclusão:

Ambos são igualmente importantes para uma criação de esquema, mas a tabela de dimensões deve ser registrada antes da tabela de fatos. Como é impossível criar tabela de fatos sem dimensões.

Top