Hurtownie danych-wprowadzenie - wykład

Nasza ocena:

3
Pobrań: 147
Wyświetleń: 1036
Komentarze: 0
Notatek.pl

Pobierz ten dokument za darmo

Podgląd dokumentu
Hurtownie danych-wprowadzenie - wykład - strona 1 Hurtownie danych-wprowadzenie - wykład - strona 2 Hurtownie danych-wprowadzenie - wykład - strona 3

Fragment notatki:

Business Intelligence prof. UE dr hab. Maria Mach-Król
Wykład 3
Hurtownie danych
CASE STUDY - DirecTV
Za pomocą oprogramowania Teradata i GoldenGate, DirecTV rozwinęła produkt, który integruje jej zasoby danych niemal w czasie rzeczywistym, w całym przedsiębiorstwie.
GoldenGate umożliwia integrację platform i systemów zarządzania danymi
W DirecTV istniały platformy Oracle, HP NonStop, system IBM DB2 i hurtownia Teradata Rezultaty: możliwość mierzenia odejść klientów w czasie rzeczywistym, wpływ na raportowanie, kampanie sprzedaży precyzyjnie ukierunkowane, co wpłynęło na zmniejszenie liczby odejść klientów. Główne zagadnienia związane z HD
Definicja hurtowni danych Charakterystyka hurtowni danych Data Marts - składnice danych Operational Data Store, Enterprise Data Warehouse, Metadane Ramy HD Architektura HD i proces ETL Rozwój HD Czym jest hurtownia danych?
Fizyczne repozytorium, w którym dane relacyjne są specjalnie zorganizowane, aby zapewnić dane obejmujące całe przedsiębiorstwo, wyczyszczone, w zestandaryzowanym formacie “Hurtownia danych to zbiór zintegrowanych, zorientowanych tematycznie baz danych, zaprojektowanych aby wspierać funkcje DSS, gdzie każda jednostka danych jest nieulotna i niezmienna i odnosi się do pewnego momentu czasowego.” Charakterystyka (cechy) HD
Zorientowana tematycznie - dane są zorganizowane według tematów Zintegrowana - zawiera dane z różnych źródeł w spójnym formacie Zależna od czasu (szereg czasowy) - przechowuje dane historyczne Nieulotna - po wprowadzeniu danych do HD, użytkownik nie może zmienić ani aktualizować danych Zsumaryzowana Nieznormalizowana Metadane - HD zawiera dane o tym, jak dane są zorganizowane i jak ich efektywnie używać Oparta na web - HD są zazwyczaj zaprojektowane tak, aby zapewnić efektywne środowisko obliczeniowe dla aplikacji webowych
relacyjna/wielowymiarowa Klient/serwer Czas rzeczywisty i/lub czas właściwy (aktywna) Składnice danych (data marts)
HD departamentu, która przechowuje tylko relewantne dane
Rodzaje: Zależna składnica danych Podzbiór stworzony bezpośrednio z HD Niezależna składnica danych Mała HD zaprojektowana dla strategicznej jednostki biznesowej lub departamentu Definicje związane z HD
Operational data stores (ODS) - operacyjny magazyn danych Rodzaj bazy danych często używany jako obszar tymczasowy hurtowni danych

(…)

… trójwarstwowej są połączone w jedną Czasami jest tylko jedna warstwa Architektury HD
Kwestie, jakie należy rozważyć, wybierając architekturę HD:
Jakiego użyć systemu zarządzania bazą danych? Np. Oracle, SQL Server, IBM DB2 Jakiego przetwarzania równoległego i/lub partycjonowania użyć? (Np. Teradata ma nowoczesne rozwiązania w tym zakresie) Jakie narzędzia migracji danych będą używane do ładowania HD…
użytkowników końcowych Ograniczenia zasobów Strategiczne spojrzenie na HD przed implementacją Kompatybilność z istniejącymi systemami Postrzegane umiejętności personelu IT Kwestie techniczne Czynniki społeczne/polityczne Integracja danych i proces ETL (Extraction, Transformation, Loading)
Integracja danych Integracja obejmuje 3 główne procesy: dostęp do danych, federacja danych (integracja widoków biznesowych…
... zobacz całą notatkę



Komentarze użytkowników (0)

Zaloguj się, aby dodać komentarz