Doporučená, 2021

Redakce Choice

Rozdíl mezi tabulkou skutečností a tabulkou rozměrů

Tabulka faktorů a tabulka rozměrů jsou základními faktory pro vytvoření schématu . Záznam tabulky faktur je kombinací atributů z různých tabulek dimenzí. Faktová tabulka pomáhá uživateli analyzovat obchodní dimenze, které mu pomáhají při rozhodování o zlepšení jeho podnikání. Na druhé straně tabulky rozměrů pomáhají sestavit tabulku faktů, aby shromáždily dimenze, na kterých musí být opatření přijata.

Bod, který odlišuje tabulku faktorů a tabulku dimenzí, spočívá v tom, že tabulka rozměrů obsahuje atributy, na kterých jsou přijata opatření ve skutečnosti . Existují i ​​další faktory, které vytvářejí rozdíly mezi tabulkou faktů a tabulkou dimenzí, aby se na ně mohly podívat, pojďme se podívat na graf porovnání.

Srovnávací graf

Základ pro porovnáníTabulka skutečnostíTabulka rozměrů
ZákladníTabulka faktorů obsahuje měření podél atributů tabulky rozměrů.Tabulka rozměrů obsahuje atributy, podél kterých tabulka faktů vypočítává metriku.
Atribut & záznamyTabulka faktů obsahuje méně atributů a více záznamů.Tabulka rozměrů obsahuje více atributů a méně záznamů.
Velikost tabulkyTabulka faktů roste svisle.Tabulka rozměrů roste vodorovně.
KlíčTabulka faktorů obsahuje primární klíč, který je zřetězení primárních klíčů všech dimenzačních tabulek.Každá tabulka kót obsahuje svůj primární klíč.
TvorbaTabulku faktů lze vytvořit pouze při dokončení tabulek kót.Nejprve je třeba vytvořit tabulky rozměrů.
SchémaSchéma obsahuje menší počet tabulek faktů.Schéma obsahuje více tabulek kót.
AtributyFaktová tabulka může mít data v číselném i textovém formátu.Tabulka rozměrů vždy obsahuje atributy v textovém formátu.

Definice tabulky skutečností

Tabulka faktorů je tabulka, která obsahuje měření podél atributů tabulek kót. Může obsahovat informace na nejnižší možné úrovni. Některé tabulky faktů obsahují pouze souhrnná data, označovaná jako souhrnná tabulka faktů . Tabulka faktů téměř obsahuje data označená datem . Pojďme diskutovat o vlastnostech tabulky faktů.

Zřetězený klíč
Tabulka faktorů obsahuje zřetězený klíč, což je zřetězení primárních klíčů všech tabulek kót. Zřetězená tabulka faktů musí jednoznačně identifikovat řádek v tabulce faktů.

Data Obilí
Datové zrnko ukazuje, jak hluboko byla měření uložena. Datové zrno musí být na nejvyšší možné úrovni.

Aditivní opatření
Atributy tabulky faktů mohou být plně aditivní nebo semi-aditivní . Plně aditivní opatření jsou ta, která lze snadno shrnout pro všechny rozměry v tabulce faktů. Například Quantity_ordered je atribut, který lze shrnout pro všechny dimenze. Stejně jako my můžeme uzavřít celkové množství, pro konkrétního zákazníka, region, datum, značku, atd. Poloautitivní opatření jsou ta, která mohou být shrnuta podél některých rozměrů tabulky faktů, ale ne všech rozměrů. Stejně jako bilanční částku nelze sčítat v čase, protože se mění v čase.

Řídká data
Někdy můžeme vidět záznamy v tabulce faktů, která má atributy s nulovými měřítky . Například na dovolené nemusí být žádná objednávka. Atributy pro toto datum tedy budou mít null opatření. Pro takový druh záznamů nemusíme ukládat opatření, protože neposkytuje žádné informace.

Degenerované rozměry
Někdy můžete narazit na některé rozměry v tabulce faktů, které nejsou vůbec doplňkové. Například číslo_příkazu, customer_id, tyto typy dimenzí nelze přidat. V případě, že v tomto měsíci potřebujete najít objednávku, kterou provedl konkrétní zákazník; pak budete potřebovat customer_id, aby se vaše vyhledávání týkalo. Tyto typy, pokud se atributy nebo rozměry tabulky faktů nazývají Degenerovaný rozměr .

Definice tabulky rozměrů

Tabulka rozměrů je klíčovou složkou pro Start Schema. Tabulka rozměrů obsahuje atributy, které představují rozměry, podél kterých je měření provedeno v tabulce faktů. Dále se budeme zabývat některými charakteristikami tabulky rozměrů.

Atributy a klíče
Každá tabulka Dimenze musí mít primární klíč, který jednoznačně identifikuje každý záznam tabulky. Je běžně pozorováno, že tabulka rozměrů obsahuje mnoho atributů. Zdá se tedy, že je široká, tj. Když vytváříte tabulku kót, zjistíte, že se šíří horizontálně .

Hodnoty atributů
Hodnoty atributů v tabulce dimenzí jsou zřídka numerické, většinu času najdete v atributech v textovém formátu . Například název produktu, značka, kategorie, podkategorie atd.

Vztah mezi atributy
Často můžete pozorovat, že atributy, se kterými se setkáváte v tabulce dimenzí, přímo nesouvisejí. Stejně jako Product_brand nemá nic dělat s parametrem package_date, ale oba mohou být atributy tabulky dimenzí produktu.

Normalizace
Tabulka rozměrů nemá být normalizována . Je to proto, že normalizace tabulky by vytvořila mnoho přechodných tabulek. Když dotaz zvedne atribut z tabulky rozměrů a obnoví měření podél této tabulky faktů, dotaz musí projít prostředními tabulkami, které se stanou neefektivními. Rozměrové tabulky tedy nejsou normalizovány.

Vrtání dolů, válcování
Atributy tabulky rozměrů umožňují získat podrobnosti buď přechodem z vyšší úrovně agregovaných atributů na atributy nižší úrovně. Například, pokud chcete najít celkový prodej v regionu, pak můžete vrtat dolů najít prodej podle státu, města, zip. Můžete dokonce vyhrát až k nalezení celkové prodeje nejprve zip, pak podle města a pak stát.

Více hierarchie
Tabulka dimenzí často nabízí více hierarchií. Máme například tabulku dimenzí produktu pro oddělení oddělení. Nyní máme dvě oddělení marketingu a účetnictví.

Oddělení marketingu bude postupovat podle atributů tabulky dimenzí produktu v určité hierarchii, aby získalo měření pro tabulku faktů.

V opačném případě bude účetní oddělení postupovat podle atributů tabulky dimenzí produktu v různých hierarchiích, aby získalo měření pro tabulku faktů.

Tabulka dimenzí musí tedy mít více hierarchií nebo úroveň agregace atributů, aby umožnila uživateli procházet dolů po libovolné z více hierarchií.

Evidence
Ačkoli tabulka rozměrů má příliš mnoho atributů, má méně záznamů.

Klíčové rozdíly mezi tabulkou faktů a tabulkou rozměrů

  1. Tabulka faktorů obsahuje měření podél kóty / atributů tabulky rozměrů.
  2. Tabulka faktů obsahuje více záznamů a méně atributů ve srovnání s tabulkou kót, zatímco tabulka rozměrů obsahuje více atributů a méně záznamů.
  3. Velikost tabulky faktů roste svisle, zatímco velikost tabulky rozměrů roste vodorovně.
  4. Každá tabulka kót obsahuje primární klíč pro identifikaci každého záznamu v tabulce, zatímco tabulka faktů obsahuje zřetězený klíč, což je kombinace všech primárních klíčů všech tabulek dimenze.
  5. Tabulka rozměrů musí být zaznamenána před vytvořením tabulky faktů.
  6. Schéma obsahuje méně tabulek faktů, ale více tabulek dimenzí.
  7. Atributy v tabulce faktů jsou číselné i textové, ale atributy tabulky rozměrů mají pouze textové atributy.

Závěr:

Obě jsou stejně důležité pro tvorbu schématu, ale tabulka rozměrů musí být zaznamenána před tabulkou faktů. Vzhledem k tomu, že není možné vytvořit tabulku faktur s rozměry.

Top