business intelligence wy5

0.0(0)
studied byStudied by 1 person
0.0(0)
full-widthCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/24

encourage image

There's no tags or description

Looks like no tags are added yet.

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced
Call with Kai

No study sessions yet.

25 Terms

1
New cards

OLAP (On-line Analytical Processing)

  • funkcjonalność polegająca na bieżącym wykonywaniu analiz na podstawie danych zawartych w wielowymiarowych kostkach hurtowni danych

  • krytyczne narzędzie organizacji pomagające w ustaleniu przeszłych sukcesów i niepowodzeń oraz przewidywaniu na ich podstawie przyszłych osiągnięć i ewentualnych porażek

  • obiektowo zorientowane interfejsy użytkownika, gdzie użytkownicy manipulują obiektami reprezentującymi zorganizowane grupy danych

2
New cards

Systemy klasy OLAP

  • są to narzędzia stosowane do analizy informacji gospodarczych

  • mogą być używane przez analityków, menedżerów lub kierownictwo dla uzyskania podglądu na funkcjonowanie organizacji w każdym okresie w przeszłości

  • są szybkim spójnym, interaktywnym narzędziem udostępniającym szeroki zakres widoków danych

3
New cards

komponenty systemów OLAP

  • aparat kalkulacyjny - stosowany do wykonywania operacji takich jak sumy, stosunki, kalkulacje czasowe, statystyka i szeregowanie jak również dostosowane formuły i algorytmy oraz modelowanie i prognozy

  • narzędzie przeglądu wymiarowego - do przeglądania danych w zdefiniowanych wymiarach

4
New cards

rodzaje OLAP

  • MOLAP (wielowymiarowy)

  • ROLAP (relacyjny)

  • HOLAP (hybrydowy)

5
New cards

MOLAP

  • wielowymiarowe OLAP, wykorzystujące wielowymiarowe systemy zarządzania bazą danych do przetwarzania analitycznego

  • działają na zasadzie arkusza kalkulacyjnego

  • brak skalowalności wymiarów w tym rozwiązaniu

  • bardzo wysoka wydajność pracy tego rozwiązania

6
New cards

ROLAP

  • relacyjne OLAP, wspomagane relacyjnym systemem zarządzania bazą danych

  • rozwiązanie o niskiej wydajności

  • pomiędzy bazą danych a systemem analitycznym występuje serwer metadanych

  • język zapytań to SQL

  • nie występuje problem skalowalności

7
New cards

HOLAP

  • hybrydowe OLAP, wykorzystuje architekturę MOLAP do umieszczania i przeglądania danych w agregacjach

  • bardziej szczegółowe dane są przechowywane w relacyjnej bazie danych

  • wydajność systemu większa od ROLAP ale mniejsza od MOLAP

8
New cards

proces ETL

ekstrakcja z systemów źródłowe → transformacja bazy operacyjnych → ładowanie repozytorium hurtowni

9
New cards

metody integracji danych

  • integracja schematów

  • integracja danych wirtualnych

  • integracja danych zmaterializowanych

10
New cards

integracja schematów

  • informacjami wejściowymi procesu integracji jest zbiór schematów źródłowych

  • wynikiem procesu integracji - pojedynczy (docelowy) schemat, reprezentujący jednolitą, strukturalną reprezentację schematów wejściowych.

  • wynikiem procesu integracji jest również specyfikacja odwzorowania schematów źródłowych we fragmenty schematu docelowego.

11
New cards

model przyrostowy

model jest związany z budowaniem zbioru niezależnych schematów częściowych i formalizowaniem związków między encjami z poszczególnych schematów za pomocą tak zwanych asercji międzyschematowych

12
New cards

integracja wstępna

  • analiza schematów w celu opracowania ogólnej strategii ujednolicania, obejmującej wybór schematów do integracji oraz wyznaczanie kolejności integracji

  • dodatkowo mogą być ustalone preferencje poszczególnych schematów lub ich fragmentów. Wpływa to na późniejszą użyteczność i adekwatność danych reprezentowanych przez schemat globalny

13
New cards

porównanie schematów

  • analiza związków między pojęciami pochodzącymi z różnych schematów oraz wykrywaniu potencjalnych konfliktów

  • podczas porównywania schematów zwykle wykrywane są własności międzyschematowe

14
New cards

rodzaje konfliktów

  • konflikty różnorodności - schematy źródłowe wykorzystują różne modele danych

  • konflikty nazewnictwa - różne schematy używają różnej terminologii odnośnie tych samych danych

  • konflikty semantyczne - podobne pojęcia ze świata rzeczywistego są modelowane na różnym poziome abstrakcji

  • konflikty strukturalne - te same pojęcia są reprezentowane za pomocą różnych konstrukcji

15
New cards

dopasowanie schematów

  • najczęściej odbywa się w sposób półautomatyczny, gdzie konflikty zgłaszane przez system są rozstrzygane przez projektanta

  • schematy są często modelowane jako abstrakcyjne typy danych, a przekształcenia schematów wyraża w pojęciach interpretacji sygnatury

16
New cards

scalanie i restrukturyzacja schematów

  • tworzony jest schemat globalny, będący wynikiem nakładania na siebie dopasowanych schematów

  • ta technika może następować za pomocą binarnego operatora scalania schematów wyrażonych w ogólnym modelu danych

  • technika zwana integracją strukturalną pozwala na integrację obiektów wykazujących podobieństwo strukturalne

17
New cards

integracja danych wirtualnych

  • informacje wejściowe obejmują zbiory danych źródłowych

  • wynikiem jest specyfikacja globalnego i jednolitego dostępu do tych danych, biorąc pod uwagę określone potrzeby użytkowników i autonomię źródeł danych

18
New cards

integracja danych zmaterializowanych

  • informacje wejściowe obejmują zbiory danych źródłowych

  • wynikiem jest zbiór danych, stanowiący jednolitą pod względem struktury i zawartości reprezentację źródeł

  • głównym zagadnieniem jest obsługa perspektyw związana z aktualizacją informacji źródłowych

19
New cards

perspektywy samoobsługowe

umożliwiają bezpośrednią aktualizację na podstawie jedynie dziennika źródeł danych

20
New cards

etapy oczyszczania danych

  • parsowanie

  • poprawianie

  • standaryzowanie

  • dopasowywanie

  • konsolidowanie

21
New cards

parsowanie

Lokalizuje i identyfikuje indywidualne elementy danych w plikach źródłowych a następnie oddziela te elementy danych w plikach docelowych

22
New cards

poprawianie

Jest związane z parsowaniem indywidualnych komponentów danych poprzez wykorzystanie złożonych algorytmów i źródeł danych wtórnych

23
New cards

standaryzowanie

Stosuje rutynowe konwersje w celu transformacji danych na preferowany i spójny temat, używając standardowych i indywidualnych reguł biznesowych

24
New cards

dopasowywanie

Wyszukiwanie i dopasowywanie rekordów wewnątrz i pomiędzy parsowanymi, poprawianymi i standaryzowanymi danymi, bazując na predefiniowanych regułach biznesowych w celu eliminacji duplikatów

25
New cards

konsolidacja

Analiza i identyfikowanie powiązań pomiędzy rekordami i scalanie ich w jedną całość