Data Management a Internetové Technologie

Vnímání reality a role technologických systémů

  • Individuální realita: Každý jedinec vnímá svět subjektivně skrze 5 smyslů (zrak, sluch, čich, hmat, chuť), což vede k různým reakcím na stejnou skutečnost.

  • IS jako systém chování: Živé organismy využívají informační systémy k rozhodování o chování s cílem přežití (např. migrace, zimní spánek).

  • Člověk vs. zvíře: Zvíře naplňuje přímé biologické potřeby v souladu s přírodou. Člověk realizuje „druhé akty“, kterými přeměňuje přírodu pomocí techniky a vytváří „nadpřírodu“.

  • Vývoj techniky:

    • Technika náhody: Pravěký člověk, nevědomé technické akty.

    • Technika řemeslníka: Uvědomění si speciální dovednosti, předávání znalostí (mistr-učedník).

    • Technika techniky: Nástup strojů a vědy v 19.stoletıˊ19. století, úplná závislost na technice.

  • Interpretace dat: V digitální době narůstá role „interpretů“ (HW/SW zařízení), protože lidské smysly nejsou schopny vnímat data přímo z nosičů (např. DVD, flash disk).

Hierarchie dat, informací a znalostí

  • Data: Reprezentace skutečnosti (text, čísla, audio, video) bez kontextu.

  • Informace: Data v kontextu, která mají smysl. Kontext zahrnuje formát, časový rámec a význam použití.

  • Znalost: Porozumění, vnitřní osvojení informací a jejich začlenění do souvislostí.

  • Meta-data: „Data o datech“ (např. definice struktur XML/JSON), která pomáhají vytvořit kontext a zlepšit kvalitu informací.

  • Struktura dat:

    • Strukturovaná (metadata obsažena).

    • Semi-strukturovaná (částečná metadata, např. HTML).

    • Nestrukturovaná (obsah internetu).

Data Management (DAMA)

  • Definice: Plánování a dohled nad daty k zajištění jejich kontroly, bezpečnosti a hodnoty dle standardu DAMA-DMBOK (2010).

  • Cíle:

    • Porozumění informačním potřebám.

    • Zajištění integrity a kvality dat.

    • Ochrana před neoprávněným použitím.

  • Funkce řízení dat: Zahrnuje 10 oblastí, např. management architektury, bezpečnosti, meta-dat, kvality dat a datových skladů.

  • Životní cyklus dat: Zahrnuje fáze od plánování a specifikace, přes tvorbu, udržování a užití, až po archivaci nebo očištění.

Business Intelligence (BI) a jeho vrstvy

  • Definice: Sada konceptů a technologií pro podporu rozhodovacích procesů založená na multidimenzionálním pohledu na data.

  • Architektonické vrstvy:

    • Extrakční vrstva (ETL/EAI): Sběr, čištění a nahrávání dat ze zdrojových systémů.

    • Ukládací vrstva: Datové sklady (Data Warehouse), datová tržiště (Data Marts), operativní a dočasná úložiště.

    • Analytická vrstva: Reporting (standardní/ad hoc), OLAP (dynamické úlohy), Data Mining (hledání vzorů).

    • Prezentační vrstva: Dashboards, portály, systémy EIS (Executive Information Systems).

  • Důvody vzniku: Omezení transakčních aplikací (OLTP), které jsou pomalé pro komplexní dotazy a neposkytují pružnou změnu kritérií analýzy.

Multidimenzionální modelování a OLAP

  • Datová kostka: Struktura pro analýzu vícerozměrných dat.

  • Složky modelu:

    • Fakta: Numerické míry (např. tržby, množství), které jsou předmětem analýzy.

    • Dimenze: Hierarchicky uspořádané kategorie (např. Čas, Produkt, Lokace), které dávají faktům kontext.

  • Schémata: Hvězda (Star) a Sněhová vločka (Snowflake).

  • OLAP Operace:

    • Roll-up: Agregace dat na vyšší úroveň.

    • Drill-down: Rozpad dat na detailnější úroveň.

    • Pivoting: Otáčení kostky pro změnu úhlu pohledu.

    • Slicing/Dicing: Vyřezávání částí kostky nebo filtrování více dimenzí.

  • Typy úložišť:

    • MOLAP: Multidimenzionální, rychlá odezva.

    • ROLAP: Relační, flexibilní pro ad-hoc dotazy.

    • HOLAP: Hybridní kombinace obou.

    • DOLAP: Desktopový OLAP pro lokální práci.