D�vidas ETL / DW

NoSQL

Modelagem

JSON

OLAP

02/03/2017

Estou iniciando os trabalhos de implementa��o de um DW na minha empresa. Irei ter que aplicar tamb�m conceitos de ETL um pouco complexos para essa finalidade. Sei que n�o foi o foco desse curso mas minhas d�vidas tratam de DW e tamb�m de ETL. Fique a vontade se n�o quiser responder sobre ETL. Seguem:

1. Consigo implementar usando o ETL tanto uma tabela hist�rica quanto uma tabela "base" (atualizada) onde eu consiga comparar os dados de modo a, caso uma das colunas da tabela de destino possua conte�do diferente do conte�do que est� sendo trazido, ele gere uma vers�o nova na tabela hist�rico e atualize os dados na tabela "base"?

2. Caso eu esque�a de incluir uma ou mais colunas ou mesmo tabelas durante o mapeamento inicial da implementa��o do DW e, ap�s j� ter rodado o processo de extra��o e carga do ETL no mesmo durante um certo tempo, existe a possibilidade de incluir tais objetos posteriormente trazendo os dados hist�ricos at� ent�o para o mesmo?

3. Como posso trabalhar com mais de uma tabela fato? Quanto isso poderia reduzir a performance na execu��o do cubo? Terei que fazer mais de um datamart ou cubo com perspectivas espec�ficas nesse caso sem que possa cruzar as informa��es entre as fato e dimens�es de ambas as fato?

4. Tenho uma situa��o que � a seguinte: a origem dos dados s�o de uma base em MongoDB, ou seja, documentos JSON gerados a partir de arquivos XML, utilizados para a integra��o entre a empresa e o cliente. Por�m, os dados s�o muito heterog�neos.

As informa��es s�o fornecidas por fontes de consultas, ex: RFB, SINTEGRA (27 estados), SERASA, SUFRAMA, ANTT, IBAMA, etc, que possuem como identificador �nico tanto um CNPJ quanto CPF, CNPJ e RNTRC, CPF e NIT, etc. S�o retornados dados que ser�o aproveitados para um estrutura para fins de cadastro (PJ, PF, ve�culo, im�vel, etc) como tamb�m a situa��o do objeto de pesquisa no respectivo �rg�o. Tamb�m terei que cruzar tais informa��es com os dados de NFS, NF-e e CT-e (prestador, tomador, fornecedor, cliente, transportador, etc), disponibilizando tamb�m dados de produtos, NCM, impostos, etc.

Como poderia modelar isso? Confesso que estou bem perdido nessa defini��o, visto que, al�m de n�o ter ideia de qual estrutura relacional devo montar, tamb�m n�o sei at� que ponto � mais ben�fico desnormalizar certos dados visando melhorar a performance do BI e at� que ponto seria mais vi�vel desmembrar certas estruturas mais independentes.

Obrigado pessoal!

Caio

Curtidas 0

POSTAR