Hurtownie danych prof. dr hab. Jerzy Gołuchowski
Wykład 2
SOA (service oriented architecture) - kit. Warstwa logiki oddzielona od warstwy wykonania.
Kolejne poziomy przetwarzania
Wzrastająca wartość dla organizacji
Dane -(odczyt przetwarzanie)Informacja-(Weryfikacja, interpretacja, przyswajanie)Wiedza-(Synteza, analiza)Decydowanie-(Ocena użyteczności stosowanie)Mądrość
OLTP do informacji, dalej działa człowiek.
Czynnik ludzki określa co jest wiedzą, a co informacją - dlatego nie mamy konkretnej definicji.
Zmienna - {nazwa zmiennej; wartość zmiennej}
Przykład. Kowalski dostaje dane, że zarabia 3000, a Nowak 4000. Informacja: Nowak zarabia więcej niż Kowalski (pewna relacja). Kowalski mówi o tym szefowi, a on mówi, że o tym wie, ale tego nie zmieni. Co na tym zyskuje Kowalski - wiedzę. Podejmuje decyzję, że zmienia pracę. Jeśli w nowej pracy go szanują, płacą więcej to była to mądra decyzja.
Potrzeby użytkownika
Trójkąt:
Top - Decyzje strategiczne, wytyczanie celów, polityki i kierunków rozwoju firmy.
Mid - Decyzje taktyczne, planowanie, finansowanie, kontrola, rachunek marginalny, kampanie marketingowe
Bottom - Działalność operacyjna, obsługa klienta, bieżące rozrachunki, kadry, płace, zakupy
Top & Mid - spojrzenie całościowe, niesprecyzowane, nieokreślone potrzeby, różne perspektywy, brak standardów
Mid & Bottom - Systemy standardowe w dziedzinie, dobrze dopasowane do znanych potrzeb
Top & Mid - Hurtownie danych (nie do końca)
Mid & Bottom - Systemy transakcyjne i dane operacyjne
Próba rozszerzenia SQL - operacje Rollup i CUBE
W standardzie SQL brakuje funkcji wspomagających analizę danych (np. raporty z podsumowaniami)
Mimo iż standard nie zawiera tych operacji zarówno Oracle jak i MS SQL oferują operacje agregacji danych: CUBE i ROLLUP
Składnia
select… group by lista_kolumn with {cube|rollup} (MS SQL)
Select … group by {cube|rollup} lista_kolumn (Oracle)
Klauzule tworzą dodatkowe podsumowania w tworzonym zestawie rekordów
Charakterystyka użytkowników HD
Operują na dużych ilościach danych, najczęściej zagregowanych i/lub sumarycznych. W takich przypadkach (badania statystyczne, porównawcze, zestawienia, raporty) wykonanie odpowiednich zapytań nie jest możliwe w czasie rzeczywistym
Operują na danych historycznych
Potrzebują efektywnego systemu zdawania pytań
Potrzebują stałego dostępu do danych nawet wtedy, gdy systemy źródłowe zawiodą
(…)
…, analitycy, decydenci wyższych szczebli, doradcy, członkowie zarządów, członkowie rad nadzorczych
Warstwowa architektura HD.
Warstwa
Zasilanie - wiele źródeł, integracja danych (najbardziej niebezpieczny i najdroższy etap)
Przechowywanie - hurtownia danych i zintegrowane metadane
Udostępnianie - Przekształcanie danych - ODS
Front-end - Użytkownicy końcowi
Składniki systemu business intelligence (inteligencja, ale też wywiad)
OLTP - (ETL) > HD -> Narzędzia analityczne i narzędzia Data Mining oraz Narzędzia prezentacji
BI = narzędzia pozyskiwania, ekstrakcji i oczyszczania danych + hurtownia danych (HD) + narzędzia analityczne + warstwa prezentacji
Od HD do BI
Narzędzia wspomagające zasilanie HG
Potrzebne aby łączyć systemy heterogeniczne:
Bramki do różnych protokołów sieciowych
Sterowniki ODBC…
... zobacz całą notatkę
Komentarze użytkowników (0)