Data Dictionary: o modalitate de cum și cele mai bune practici

Un dicționar de date este o listă de termeni și metrici cheie cu definiții, un glosar de afaceri. Deși sună simplu, aproape banal, capacitatea sa de a alinia afacerea și de a elimina confuzia poate fi profundă. De fapt, un dicționar de date este probabil unul dintre cele mai valoroase artefacte pe care o echipă de date le poate livra afacerii.

Majoritatea întreprinderilor au cel puțin un concept, termen sau metric care este utilizat sau interpretat diferit între echipe. Când se întâmplă acest lucru, confuzia domnește. Factorii de decizie pot fi de acord cu ceea ce arată datele și ce acțiuni trebuie întreprinse. Rapoartele dintre echipe pot afișa numere diferite pentru aceeași măsură din aceeași sursă de date, datorită logicii de afaceri inconsecvente. Echipele pot chiar să se certe despre definiția corectă și să-și apere gazonul, poate pentru că definiția lor face ca numerele lor să arate mai bine. Acest lucru nu este bun pentru afaceri.

După ce ai un dicționar de date, este un document pe care tot personalul îl poate face referință și se află pe aceeași pagină, ușurează personalul nou la bord, iar echipa de informații de afaceri (BI) are cerințe clare pentru implementarea acestor valori.

Pentru a fi clar, nu avem în vedere documentația brută a tabelului bazelor de date, deși aceasta este importantă, ci o listă la nivel superior de termeni și valori de afaceri. Cum crede întreaga companie „utilizator”, „venit” sau „cost de achiziție”? Toată lumea are aceeași înțelegere sau „teritoriu de vânzare”, „timp mediu de livrare” sau „sesiune”? Obiectivul ar trebui să fie ca un membru al personalului, care nu este tehnic, precum un agent de servicii pentru clienți, să poată citi secțiunea pentru partea lor de activitate și să înțeleagă termenii relevanți, dar suficient de detaliate și exacti pentru a surprinde logica de afaceri. din aceste valori.

În această postare, voi detalia câteva cele mai bune practici care înconjoară dicționarele de date și un proces despre cum puteți crea unul. Acesta nu este în niciun caz singurul proces care va funcționa, dar cel puțin a funcționat pentru mine. Aici, presupun că echipa de BI conduce acest proces. În opinia mea, ar trebui să dețină dicționarul de date și implementarea metricilor în instrumentele BI.

1. Colectați termenii

Primul pas este alcătuirea unei liste de termeni. Adică, echipa de BI ar trebui să creeze o foaie de calcul cu o listă cu numele conceptelor și valorilor (măsurilor) și modul în care datele sunt tăiate și tăiate (dimensiunile). În timp ce acest lucru sună descurajant, o abordare este de a merge echipa de afaceri de echipa de afaceri și de a examina un eșantion de toate rapoartele lor standard și tablourile de bord. Enumerați toate etichetele axelor din diagrame, anteturile coloanelor din tabelele de raport și dimensiunile modului în care sunt pivotate datele. Astfel, un raport care arată venituri pe teritorii (pentru o perioadă de timp) dă doi termeni cheie: „venituri” și „teritoriu”. În această etapă, doar compilați o listă de nume de termeni, nu definițiile lor.

Rezultatul este o listă cu numele echipei, numele termenului, tipul de date, o valoare de exemplu sau două și, probabil, o legătură către un raport de exemplu care utilizează acest termen. Coloane suplimentare pe care poate fi util să le adăugați sunt o coloană care indică dacă aceasta este o dimensiune sau o măsură (în general există mai multe acorduri asupra dimensiunilor decât măsurile) și o coloană care specifică sursa adevărului.

Pasul 1: o listă de termeni fără definiții

Organizați și grupați lista în funcție de afaceri, cum ar fi valorile financiare, valorile de marketing, valorile serviciilor clienți, etc. De asemenea, este posibil să doriți să spargeți dimensiuni cu adevărat generice („an”, „produs_id”, „țară” etc) care se întind pe mai multe echipe la secțiunea lor.

Lista nu este probabil atât timp cât vă așteptați. Acest lucru se datorează faptului că echipele tind să aibă un set relativ mic de valori pe care încearcă să le urmărească și să le optimizeze cu un set relativ mic de pârghii la dispoziție - de exemplu, marketingul online s-ar putea concentra pe câteva aspecte cheie precum campanie, canal, cheltui și segmentează.

Rugați echipa de afaceri să arunce o privire peste listă, în special secțiunea lor și adăugați termenii care lipsesc. Dacă au un set robust de tablouri de bord și rapoarte, probabil aveți o listă cuprinzătoare. Dacă nu o fac, atunci aceasta oferă concepte suplimentare care sunt valoroase de colectat.

2. Definiți termenii

Echipa de BI ar trebui să facă acum o primă trecere când încearcă să colaboreze sau să creeze definiții.

Mai întâi, trageți orice definiție din orice documentație existentă. Aceasta ar putea fi de la un wiki, rapoarte anuale sau de la un cod real, cum ar fi interogări SQL sau macrocomenzi Excel. Definițiile ar trebui să fie clare și lipsite de ambiguitate. Dacă este mai clar să arate o formulă simplă (cum ar fi ARPU = total_revenue / number_subscribers), mai degrabă decât să scrieți o definiție, atunci arătați asta. Majoritatea personalului ar trebui să poată înțelege definiția, chiar dacă trebuie să facă referință la unii dintre termeni.

În al doilea rând, așezați-vă cu echipele, una câte una și cereți ajutorul lor pentru a stabili orice definiție care lipsește sau pentru a perfecționa definițiile. (Veți face progrese mai bune începând cu o definiție, chiar dacă este greșită, decât cu o celulă goală.) Acest lucru poate necesita unele înainte și înapoi până când veți obține un acord în cadrul acelei echipe. Poate fi necesară, de asemenea, unele cercetări cu privire la modul în care este calculată o măsurătoare în prezent.

Este important să nu vă întrebați „care este definiția actuală?”, Ci „cum ar trebui definită aceasta?” Dacă implementarea actuală nu este definiția lor ideală, aceasta este șansa perfectă pentru echipa de afaceri să își stabilească starea ideală. De exemplu, aceasta este o șansă de a simplifica dacă ați moștenit o definiție prea complexă. Odată ce definiția ideală este capturată, atunci există o presiune suplimentară asupra echipei de date, a echipei tehnice sau a altor părți ale activității pentru a furniza metrica respectivă așa cum este definită.

3. Identificarea conflictelor

Acesta este un pas cheie: eliminați termenii în care definiția sa diferă între echipe.

4. Obțineți aliniere

Pentru acei termeni care diferă între echipe, aduceți echipele relevante în aceeași cameră (și blocați ușa). Spune-i să discute cum și de ce diferă.

Pentru această întâlnire, ar trebui să existe un acord cu doar 2 rezultate:

* o echipă este de acord să adopte definiția celeilalte echipe.

* au motive legitime pentru care diferă. În acest caz, consimte un nou nume pentru unul sau ambii termeni.

(O a treia opțiune în care ambele echipe convin să modifice definiția lor în anumite definiții comune este posibilă, dar este mai puțin probabilă.)

Denumirile trebuie să fie atâta timp cât este necesar pentru a evita ambiguitatea sau confuzia. Dacă „community_adjusted_editba” este un termen mai adecvat și mai potrivit, care îl distinge de „ebitda” obișnuită, atunci folosiți acest termen mai lung, mai descriptiv. Scopul este de a elimina confuzia pentru a nu fi obosită.

5. Scoateți-vă

Solicitați-vă șefilor de echipă să se înscrie. Acest lucru este crucial. Nu doriți ca echipa BI să definească un termen și echipa de afaceri să nu fie în dezacord. În acest caz, afacerea va merge pur și simplu și va implementa propria lor logică în Excel și vă veți întoarce la unul pătrat. În calitate de experți în domeniu și ca oameni care vor lua decizii de afaceri pe baza acestor valori, acei proprietari de afaceri trebuie să fie pe deplin la bord.

La Warby Parker, am profitat de ajutorul co-CEO-urilor pentru a cere ca șefii de echipă să se înscrie și să facă asta până la o anumită dată. Șefii de echipă sunt ocupați și este posibil ca un dicționar de date să nu pară prioritar, chiar dacă pot vedea valoarea. Astfel, acest sprijin de sus în jos s-a dovedit a fi foarte valoros.

6. Publică

Publicați dicționarul de date ca un document cu o singură pagină, acolo unde este accesibil întregii companii - astfel, nu doar într-un instrument BI. Aceste definiții ar trebui să fie înțelese și adoptate pe scară largă, nu doar de către experți, analiști și factorii de decizie, ci de tot personalul. Prin urmare, vizibilitatea este crucială. Dacă compania folosește foarte mult un wiki, le publică acolo. Ar trebui să fie acolo unde se așteaptă oamenii.

Conceptual, acești termeni sunt independenți de orice sistem unic sau sursă de date și astfel nu sunt legați de un instrument BI. Cu toate acestea, definițiile individuale ar trebui să fie coapte și în instrumentele de BI, atunci când este posibil. Dacă instrumentul acceptă acest lucru, atunci când faceți mouse-ul peste o dimensiune sau o măsură, definiția și exemplul ar trebui să apară.

Având în vedere că aceste definiții pot apărea în mai multe locuri, echipa de date ar trebui să se străduiască să genereze automat dicționarul de date dintr-o singură sursă, cum ar fi o tabelă de date sau un depozit de coduri, mai degrabă decât să mențină manual un tabel static. De exemplu, la Warby Parker, dicționarul nostru de date a fost generat dintr-o lucrare Jenkins. Dacă depozitul a fost modificat, acesta a regenerat documentația noastră (un site web dedicat sau o „carte de date” pentru toată documentația de date).

7. Mențineți

Deși valorile cheie ar trebui să fie relativ stabile, pot exista motive legitime de afaceri pentru care definiția unei valori ar trebui să se modifice. Această schimbare și o nouă definiție ar trebui să vină din partea echipei de afaceri. Cu toate acestea, va necesita ajutorul echipei de date pentru a implementa schimbarea și a comunica.

Echipa de BI ar trebui să evalueze impactul schimbării înainte de derularea acesteia. De exemplu, pregătiți un grafic care arată metrica atât cu definiția veche, cât și cu cea nouă, pentru a stabili așteptările cu privire la modul în care se pot schimba numerele.

Tratați această schimbare de definiție ca o versiune a produsului: comunicați în avans modificarea definiției, spuneți-le oamenilor la ce să se aștepte și documentați schimbarea în dicționarul de date, cum ar fi cu un jurnal de modificări din partea de jos a documentului.

Nu lăsați sincronizarea diferitelor sisteme; de aceea, de ce este valoroasă generarea automată de documentație.

A crea un dicționar de date în urma procesului de mai sus nu este un efort mic. Probabil că va dura câteva luni, deoarece necesită conversații și coordonare între mulți membri ai personalului. Este un efort mare al echipei, condus și coordonat de echipa BI, dar care necesită o achiziție largă, cooperare și efort și o serie de întăriri de sus în jos.

Nu sugerez să luați procesul bucată. De exemplu, nu creați un dicționar de date de marketing complet coapte cu așteptarea de a finanța dicționarul de date la o dată ulterioară. Acest lucru face mai dificil să se ajungă la acele discuții de aliniere (pasul 4) între echipe și de acolo se întâmplă plata reală. De asemenea, natura secvențială face mai ușor să pierdeți aburi. Aveți nevoie de discuțiile concomitente între echipele cu un semn de ieșire comun pentru a atinge obiectivul.