Corso di formazione Data Vault: Building a Scalable Data Warehouse
Data Vault La modellazione è una tecnica di modellazione di database che fornisce l'archiviazione storica a lungo termine di dati provenienti da più fonti. Un archivio dati memorizza un'unica versione dei fatti, ovvero "tutti i dati, sempre". Il suo design flessibile, scalabile, coerente e adattabile comprende i migliori aspetti della 3a forma normale (3NF) e dello schema a stella.
In questo corso di formazione dal vivo con istruttore, i partecipanti impareranno come costruire un Data Vault.
Al termine di questo corso di formazione, i partecipanti saranno in grado di:
- Comprendere i concetti di architettura e design alla base di Data Vault 2.0 e la sua interazione con Big Data, NoSQL e l'intelligenza artificiale.
- Utilizza le tecniche di data vaulting per abilitare il controllo, la traccia e l'ispezione dei dati cronologici in un data warehouse.
- Sviluppa un processo ETL (Extract, Transform, Load) coerente e ripetibile.
- Crea e distribuisci magazzini altamente scalabili e ripetibili.
Formato del corso
- In parte lezione, in parte discussione, esercizi e pratica pratica pesante
Struttura del corso
Introduzione
- Le carenze delle architetture di modellazione dei dati warehouse esistenti
- Vantaggi della modellazione Data Vault
Panoramica dei principi di architettura e design Data Vault
- SEI / CMM / Conformità
Data Vault Applicazioni
- Data warehousing dinamico
- Magazzinaggio esplorativo
- In-Database Data Mining
- Collegamento rapido di informazioni esterne
Data Vault Componenti
- Hub, collegamenti, satelliti
Costruire un Data Vault
Modellazione di hub, collegamenti e satelliti
Data Vault Norme di riferimento
Come i componenti interagiscono tra loro
Modellazione e popolamento di un Data Vault
Conversione di 3NF OLTP in un Data Vault Enterprise Data Warehouse (EDW)
Informazioni sulle date di caricamento, le date di fine e le operazioni di join
Business Chiavi, relazioni, tabelle di collegamento e tecniche di join
Tecniche di interrogazione
Elaborazione del carico ed elaborazione delle query
Panoramica della metodologia Matrix
Inserimento dei dati nelle entità di dati
Caricamento delle entità hub
Caricamento delle entità di collegamento
Caricamento dei satelliti
Utilizzo di modelli SEI/CMM di livello 5 per ottenere risultati ripetibili, affidabili e quantificabili
Sviluppo di un processo ETL (Extract, Transform, Load) coerente e ripetibile
Creazione e implementazione di magazzini altamente scalabili e ripetibili
Osservazioni conclusive
Requisiti
- Comprensione dei concetti di data warehousing
- Comprensione dei concetti di database e modellazione dei dati
Pubblico
- Modellatori di dati
- Specialista del data warehousing
- Business Specialisti dell'intelligence
- Ingegneri dei dati
- Database Amministratori
I corsi di formazione interaziendali richiedono più di 5 partecipanti.
Corso di formazione Data Vault: Building a Scalable Data Warehouse - Booking
Corso di formazione Data Vault: Building a Scalable Data Warehouse - Enquiry
Data Vault: Building a Scalable Data Warehouse - Richiesta di consulenza
Richiesta di consulenza
Recensioni (1)
how the trainor shows his knowledge in the subject he's teachign
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Corso - Data Vault: Building a Scalable Data Warehouse
Corsi in Arrivo
Corsi relativi
Cluster Analysis with R and SAS
14 oreQuesto corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto agli analisti di dati che desiderano programmare con R in SAS per l'analisi dei cluster.
Al termine di questa formazione, i partecipanti saranno in grado di:
- Usare l'analisi dei cluster per il data mining
- Sintassi Master R per le soluzioni di clustering.
- Implementare il clustering gerarchico e non gerarchico.
- Prendi decisioni basate sui dati per migliorare le operazioni aziendali.
From Data to Decision with Big Data and Predictive Analytics
21 orePubblico
Se cerchi di dare un senso ai dati a cui hai accesso o desideri analizzare i dati non strutturati disponibili in rete (come Twitter, Linked in, ecc ...) questo corso fa per te.
Si rivolge principalmente ai decisori e alle persone che devono scegliere quali dati devono essere raccolti e quali vale la pena analizzare.
Non si rivolge alle persone che configurano la soluzione, ma quelle persone trarranno beneficio dal quadro generale.
Modalità di consegna
Durante il corso, ai delegati verranno presentati esempi funzionanti di tecnologie prevalentemente open source.
Seguiranno brevi lezioni con presentazione e semplici esercitazioni da parte dei partecipanti
Contenuto e software utilizzati
Tutto il software utilizzato viene aggiornato ogni volta che il corso viene eseguito, quindi controlliamo le versioni più recenti possibili.
Copre il processo dall'ottenimento, formattazione, elaborazione e analisi dei dati, per spiegare come automatizzare il processo decisionale con l'apprendimento automatico.
Data Mining and Analysis
28 oreObiettivo:
I delegati sono in grado di analizzare grandi set di dati, estrarre modelli, scegliere la giusta variabile che influisce sui risultati in modo da prevedere un nuovo modello con risultati predittivi.
Data Mining
21 oreIl corso può essere fornito con tutti gli strumenti, compreso il software e le applicazioni di data mining open source gratuiti
Data Mining with Python
14 orequesta formazione Live (in loco o remota) guidata da istruttori è rivolta a analisti di dati e data scientist che desiderano implementare tecniche di analisi dei dati più avanzate per il data mining utilizzando Python.
entro la fine di questa formazione, i partecipanti saranno in grado di:
- comprendere importanti aree di data mining, tra cui l'estrazione delle regole di associazione, l'analisi del sentiment del testo, il riepilogo automatico del testo e il rilevamento di anomalie dei dati.
- Confronta e implementa varie strategie per risolvere i problemi di data mining del mondo reale.
- comprendere e interpretare i risultati.
formato del corso
- conferenza interattiva e discussione.
- un sacco di esercizi e pratica.
- implementazione hands-on in un ambiente lab Live.
Opzioni di personalizzazione del corso
- per richiedere una formazione personalizzata per questo corso, si prega di contattarci per organizzare.
Data Mining with R
14 oreR è un linguaggio di programmazione gratuito open source per elaborazione statistica, analisi dei dati e grafica. R è utilizzato da un numero crescente di manager e analisti di dati all'interno di aziende e università. R ha una vasta gamma di pacchetti per il data mining.
Data Visualization
28 oreQuesto corso è rivolto a ingegneri e decisori che lavorano nel data mining e nella scoperta di conoscenze.
Imparerai come creare trame e modi efficaci per presentare e rappresentare i tuoi dati in un modo che possa attrarre i responsabili delle decisioni e aiutarli a comprendere le informazioni nascoste.
Data Mining with Excel
14 oreQuesto corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto ai data scientist che desiderano utilizzare Excel per il data mining.
- Al termine di questa formazione, i partecipanti saranno in grado di:
- Esplorare i dati con Excel per eseguire analisi e data mining.
- Utilizzare Microsoft algoritmi per il data mining.
- Comprendere i concetti relativi al data mining di Excel.
Data Mining with Weka
14 oreQuesto corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto ad analisti di dati e data scientist di livello principiante e intermedio che desiderano utilizzare Weka per eseguire attività di data mining.
Al termine di questo corso di formazione, i partecipanti saranno in grado di:
- Installare e configurare Weka.
- Comprendere l'ambiente Weka e l'ambiente di lavoro.
- Eseguire attività di data mining utilizzando Weka.
Data Mining & Machine Learning with R
14 oreR è un linguaggio di programmazione gratuito open source per il calcolo statistico, l'analisi dei dati e la grafica. R è utilizzato da un numero crescente di manager e analisti di dati all'interno di aziende e università. R dispone di un'ampia gamma di pacchetti per il data mining.
Data Science for Big Data Analytics
35 oreI big data sono insiemi di dati così voluminosi e complessi che i tradizionali software applicativi per l'elaborazione dei dati non sono adeguati per gestirli. Le sfide relative ai big data comprendono l'acquisizione di dati, l'archiviazione dei dati, l'analisi dei dati, la ricerca, la condivisione, il trasferimento, la visualizzazione, l'interrogazione, l'aggiornamento e la riservatezza delle informazioni.
Foundation R
7 oreL'obiettivo del corso è consentire ai partecipanti di acquisire una padronanza dei fondamenti di R e di come lavorare con i dati.
KNIME Analytics Platform for BI
21 oreLa piattaforma di analisi KNIME è un'opzione open source leader per l'innovazione basata sui dati, che ti aiuta a scoprire il potenziale nascosto nei tuoi dati, a estrarre nuove informazioni o a prevedere nuovi futuri. Con oltre 1000 moduli, centinaia di esempi pronti per l'uso, una gamma completa di strumenti integrati e la più ampia scelta di algoritmi avanzati disponibili, la piattaforma di analisi KNIME è la cassetta degli attrezzi perfetta per qualsiasi scienziato di dati e analista aziendale.
Questo corso per KNIME Analytics Platform è un'opportunità ideale per principianti, utenti avanzati ed esperti KNIME da presentare a KNIME , per imparare a usarlo in modo più efficace e come creare report chiari e completi basati su flussi di lavoro KNIME
Platforma analityczna KNIME - szkolenie kompleksowe
35 oreIl corso di formazione "Analytics Platform KNIME" offre una panoramica completa di questa piattaforma gratuita di analisi dei dati. Il programma include un'introduzione all'elaborazione e all'analisi dei dati, all'installazione e alla configurazione KNIME, alla costruzione del flusso di lavoro, alla metodologia per la creazione di modelli di business e alla modellazione dei dati. Il corso discute anche strumenti avanzati di analisi dei dati, importazione ed esportazione di flussi di lavoro, integrazione di strumenti, processi ETL, data mining, visualizzazione, estensioni e integrazioni con strumenti come R, Java, Python, Gephi, Neo4j. La conclusione include una panoramica della reportistica, l'integrazione con BIRT e KNIME WebPortal.
Oracle SQL Intermediate - Data Extraction
14 oreL'obiettivo del corso è quello di consentire ai partecipanti di acquisire una padronanza di come lavorare con il linguaggio SQL in un database Oracle per l'estrazione di dati a livello intermedio.