Data Management a Internetové Technologie
Vnímání reality a role technologických systémů
Individuální realita: Každý jedinec vnímá svět subjektivně skrze 5 smyslů (zrak, sluch, čich, hmat, chuť), což vede k různým reakcím na stejnou skutečnost.
IS jako systém chování: Živé organismy využívají informační systémy k rozhodování o chování s cílem přežití (např. migrace, zimní spánek).
Člověk vs. zvíře: Zvíře naplňuje přímé biologické potřeby v souladu s přírodou. Člověk realizuje „druhé akty“, kterými přeměňuje přírodu pomocí techniky a vytváří „nadpřírodu“.
Vývoj techniky:
Technika náhody: Pravěký člověk, nevědomé technické akty.
Technika řemeslníka: Uvědomění si speciální dovednosti, předávání znalostí (mistr-učedník).
Technika techniky: Nástup strojů a vědy v , úplná závislost na technice.
Interpretace dat: V digitální době narůstá role „interpretů“ (HW/SW zařízení), protože lidské smysly nejsou schopny vnímat data přímo z nosičů (např. DVD, flash disk).
Hierarchie dat, informací a znalostí
Data: Reprezentace skutečnosti (text, čísla, audio, video) bez kontextu.
Informace: Data v kontextu, která mají smysl. Kontext zahrnuje formát, časový rámec a význam použití.
Znalost: Porozumění, vnitřní osvojení informací a jejich začlenění do souvislostí.
Meta-data: „Data o datech“ (např. definice struktur XML/JSON), která pomáhají vytvořit kontext a zlepšit kvalitu informací.
Struktura dat:
Strukturovaná (metadata obsažena).
Semi-strukturovaná (částečná metadata, např. HTML).
Nestrukturovaná (obsah internetu).
Data Management (DAMA)
Definice: Plánování a dohled nad daty k zajištění jejich kontroly, bezpečnosti a hodnoty dle standardu DAMA-DMBOK (2010).
Cíle:
Porozumění informačním potřebám.
Zajištění integrity a kvality dat.
Ochrana před neoprávněným použitím.
Funkce řízení dat: Zahrnuje 10 oblastí, např. management architektury, bezpečnosti, meta-dat, kvality dat a datových skladů.
Životní cyklus dat: Zahrnuje fáze od plánování a specifikace, přes tvorbu, udržování a užití, až po archivaci nebo očištění.
Business Intelligence (BI) a jeho vrstvy
Definice: Sada konceptů a technologií pro podporu rozhodovacích procesů založená na multidimenzionálním pohledu na data.
Architektonické vrstvy:
Extrakční vrstva (ETL/EAI): Sběr, čištění a nahrávání dat ze zdrojových systémů.
Ukládací vrstva: Datové sklady (Data Warehouse), datová tržiště (Data Marts), operativní a dočasná úložiště.
Analytická vrstva: Reporting (standardní/ad hoc), OLAP (dynamické úlohy), Data Mining (hledání vzorů).
Prezentační vrstva: Dashboards, portály, systémy EIS (Executive Information Systems).
Důvody vzniku: Omezení transakčních aplikací (OLTP), které jsou pomalé pro komplexní dotazy a neposkytují pružnou změnu kritérií analýzy.
Multidimenzionální modelování a OLAP
Datová kostka: Struktura pro analýzu vícerozměrných dat.
Složky modelu:
Fakta: Numerické míry (např. tržby, množství), které jsou předmětem analýzy.
Dimenze: Hierarchicky uspořádané kategorie (např. Čas, Produkt, Lokace), které dávají faktům kontext.
Schémata: Hvězda (Star) a Sněhová vločka (Snowflake).
OLAP Operace:
Roll-up: Agregace dat na vyšší úroveň.
Drill-down: Rozpad dat na detailnější úroveň.
Pivoting: Otáčení kostky pro změnu úhlu pohledu.
Slicing/Dicing: Vyřezávání částí kostky nebo filtrování více dimenzí.
Typy úložišť:
MOLAP: Multidimenzionální, rychlá odezva.
ROLAP: Relační, flexibilní pro ad-hoc dotazy.
HOLAP: Hybridní kombinace obou.
DOLAP: Desktopový OLAP pro lokální práci.