1/29
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced | Call with Kai |
|---|
No study sessions yet.
business intelligence
to system raportowania bazujący na repozytorium danych, najczęściej w postaci hurtowni danych
hurtownia danych
jest to kopia transakcyjnych danych, specyficznie ustrukturyzowana na zapytania i raportowanie
4 atrybuty hurtowni danych
uporządkowanie tematyczne
nieulotność danych
integracja danych
zawieranie wymiaru czasowego
dane w hurtowni danych
logicznie i fizycznie przetransformowane z wielu aplikacji źródłowych w celu dopasowania do struktur biznesowych (ekonomicznych)
aktualizowane i utrzymywane w dłuższym horyzoncie czasowym
wyrażone poprzez proste terminy ekonomiczne i zagregowane w celu szybkiej analizy
korporacyjna hurtownia danych
inaczej nazywane scentralizowaną hurtownią danych, jest to scentralizowane środowisko dostarczające kadrze kierowniczej informacji o przebiegu procesów w firmie w celu późniejszego ich wykorzystania w procesie podejmowania decyzji
tematyczna hurtownia danych
zawiera tylko jedną dziedzinę działalności przedsiębiorstwa
inna nazwa: składnica danych, mała hurtownia danych
implementowane najczęściej dla działu, oddziału, geograficznej lokalizacji przedsiębiorstwa
tabela faktów
zawierają nawet setki milionów wierszy
dane są aktualizowane na bieżąco
posiadają 2 rodzaje kolumn:
przechowujące dane służące do późniejszych obliczeń
przechowujące odniesienia do tabel wymiarów
tabele te mogą zawierać wzajemne powiązania pomiędzy sobą
tabela wymiarów
opisują zdarzenia z tabeli faktów
mogą przyjmować postać wielowymiarowych kostek, gdzie każdy z wymiarów nawiązuje do obszaru działalności przedsiębiorstwa
są niewielkich rozmiarów
dane zmieniają się dość rzadko
schemat gwiazdy
zestaw tabel w modelu relacyjnym zaprojektowanych jako podstawa modelu wielowymiarowego
prostota
niewielka liczba tabel
dobrze zdefiniowane ścieżki połączeń
każdy z wymiarów (region, produkt, czas lub inne) jest bezpośrednio połączony z tabelą faktów (sprzedaż, stan magazynu)
krótki czas odpowiedzi na zapytania
wysoka wydajność przetwarzania zapytań kosztem normalizacji danych
występuje najczęściej w oprogramowaniu komercyjnym
schemat płatka śniegu
klucze obce mogą zostać zagnieżdżone w wymiarach
tabele wymiarów nie zawierają zdenormalizowanych danych
powstaje dzięki ponownemu zastosowaniu procedury normalizacji w stosunku do tabel wymiarów schematu gwiazdy
sprzyja konstruowaniu złożonych hierarchii wymiarów czyniąc model danych bardziej przejrzystym
zaleca się unikania tworzenia schematu płatka śniegu, jeżeli nie jest to wymagane przez komponenty architektury
oszczędność miejsca jest minimalna podczas kiedy złożoność zapytań i procesu raportowania znacząco obniża wydajność hurtowni danych
schemat konstelacji gwiazd
alternatywne rozwiązanie dla schematu gwiazdy
konstrukcyjnie zbliżony jest do schematu gwiazdy
różnica polega na obecności wielu tabel faktów, które współdzielą tabele wymiarów
ma zastosowanie przy najbardziej skomplikowanych aplikacjach, które wymagają obecności wielu tabel faktów
bardziej skomplikowana forma wynika z różnych wariantów dla poszczególnych typów agregacji
tabele wymiarów pozostają takich rozmiarów jak w przypadku prostego schematu gwiazdy
schemat hybrydowy
powstaje z połączenia istniejących rozwiązań
najczęściej jest to połączenie zdenormalizowanych schematów gwiazdy ze znormalizowanymi schematami płatka śniegu
niektóre wymiary mogą występować w obu postaciach, w celu zaspokojenia różnorodnych wymagań dla zapytań
architektura scentralizowana
wszystkie dane wykorzystywane do analizy w organizacji przechowywane są w jednej hurtowni danych. To rozwiązanie jest mniej wydajne w porównaniu z systemami rozproszonymi. Jest to uproszczony dostęp do danych wynikający z ujednolicenia zastosowanego modelu. Utworzenie oraz utrzymywanie centralnej bazy danych jest dużo prostsze niż w przypadku systemu rozproszonego. To rozwiązanie jest stosowane w organizacjach, gdzie działalność operacyjna jest również scentralizowana. Zastosowanie architektury zdecentralizowanej przynosi korzyści jedynie w przypadku rozproszonego przetwarzania danych operacyjnych.
architektura federacyjna
Dane logicznie jednorodne, jednak przechowywane fizycznie w różnych bazach danych zlokalizowanych w jednym lub wielu systemach komputerowych. W takiej postaci globalna hurtownia danych jest tworem czysto wirtualnym. Zastosowanie architektury zdecentralizowanej przynosi korzyści jedynie w przypadku rozproszonego przetwarzania danych operacyjnych. Ponieważ zawierają znacznie mniejsze ilości danych, ich dane mogą być przedstawione i analizowane lokalnie na różnych poziomach szczegółowości. W ramach lokalnej, tematycznej, hurtowni danych przechowywane są dane właściwe konkretnemu działowi danej organizacji.
architektura warstwowa
Założenie, że hurtownia danych jest rzeczywistą, fizyczną bazą danych. Rozbudowa hurtowni danych wymaga zmian na wielu poziomach systemów komputerowych. To rozwiązanie ma krótszy czas odpowiedzi hurtowni danych, gdyż fizycznie dane są zlokalizowane bliżej użytkownika. Zmniejszenie rozmiarów przeszukiwanej bazy danych. Hurtownia globalna jest uzupełniana przez kolejne poziomy lokalnych tematycznych hurtowni danych, zawierające kopie danych poprzedniej warstwy lub ich podsumowania, z pominięciem szczegółów obecnych między innymi w strukturze federacyjnej.
dane historyczne
zbierane przez wiele lat funkcjonowania hurtowni
umieszczane na najniższym poziomie w bazie danych (tabela faktów)
mogą to być dane archiwalne lub transakcyjne
dane dostarczane
są generowane z istniejących danych za pomocą operacji matematycznych lub transformujących te dane, dzieli się je na:
elementarne - będące kopią bieżących danych źródłowych pozyskanych z baz operacyjnych i odpowiednio przetworzonych
zmaterializowane agregaty - będące wyliczonymi wartościami obliczeń w różnym przekroju (czasowym, terytorialnym) i na różnych stopniach agregacji(dzienne, miesięczne, roczne)
ładowanie i scalanie
dane są okresowo ładowane z baz operacyjnych, podczas tego procesu następuje ujednolicenie danych
agregacja
proces wyliczenia zmaterializowanych agregatów
przeniesienie do danych historycznych
dane elementarne zostają oznaczone jako historyczne, w celu późniejszej analizy mającej na celu dokonywanie porównań szeregów czasowych
usuwanie
zwykle wykonywane bardzo rzadko lub wcale
metadane
opisują dane oraz schematy obiektów
są słownikowymi informacjami opisującymi strukturę hurtowni danych, źródłowe bazy danych dla hurtowni oraz sposób wyliczania danych zagregowanych
jest to zbiór definicji wszystkich danych zawartych w hurtowni danych, zasilających hurtownię lub z niej uzyskiwanych, wraz ze wskazaniem miejsc (programów) w których te dane są używane
są używane przez aplikacji do liczenia i sprawdzania poprawności danych przechowywanych w hurtowni
dzieli się na:
systemowe
biznesowe
administracyjne
metadane systemowe
zwane inaczej nawigacyjny, opisują jakie typy danych znajdują się w systemie oraz umożliwiają produktowi właściwe działania, nie są zmieniane przez użytkowników hurtowni, gdyż są używane przez system lub administratora
metadane administracyjne
lub transformacyjne, opisują wszystkie szczegóły zarządzania danymi, takie jak harmonogram aktualizacji danych, złączenia lub podział tabel, dokonywane zmiany, stosowany system retrospekcji, czy też system źródłowy, z którego element został wydobyty
metadane biznesowe
nazywane równi metadanymi znaczeń biznesowych, skierowane bezpośrednio do użytkowników, pozwalają na znalezienie oraz zrozumienie danych zwartych w hurtowni, często zawierają silnik wyszukiwania umożliwiający przeglądanie danych w oparciu o słowa kluczowe
kolekcjonowanie
identyfikacja metadanych i ładowanie ich do centralnego repozytorium
podtrzymywanie
synchronizacja metadanych automatycznie wraz ze zmianą architektury
rozlokowanie
dostarczanie metadanych do użytkowników we właściwej formie poprzez właściwe narzędzia
aktywne zarządzanie metadanymi
jest częścią działania hurtowni danych
pasywne zarządzanie metadanymi
systemy zarządzające metadanymi są oddzielnymi produktami, umieszczanymi poza systemem hurtowni danych