Blog

Tableau – analitički i vizualizacijski alat nove generacije

Autor: Hrvoje Gabelica

Ukoliko ste upućeni u svijet podataka, onda su vam pojmovi poput Business Intelligence-a, Velikih podataka (Big Data), IoT (Internet of Things), Data scientist, Machine learninga (strojnog učenja) vjerojatno poznati. Međutim, u zadnjih nekoliko godina se počinju koristiti pojmovi poput vizualizacije podataka i poslovne analitike podataka. Iako ovi pojmovi postoje desetljećima, zadnjih nekoliko godina dobivaju maha, a sve je to omogućeno razvojem tehnologije te inovativnih alata. Jedan od njih je i Tableau, alat koji svojim specifičnim “mindsetom” iskače od svih ostalih.

Za nekoga tko se bavi Business Intelligence svijetom, vjerojatno su upućeni u “tradicionalne” reporting alati poput MS SSRS-a (Reporting Services), IBM Cognos-a, SAP Business Objects-a i ostalih. Ovi alati su odlični, stabilni, “enterprise ready” te rade svoj posao najbolje u onome za što su napravljeni, a to je izvještavanje. Pod izvještajnih sustavom podrazumijevamo podrazumijevamo stotine izvještaja u tabličnom obliku i nekom grafu koji služe različitim odjelima unutar tvrtke za donošenje raznoraznih odluka.

Kad pričam s kolegama ili potencijalnim klijentima, uvijek dobijem pitanje poput: “Dobro taj Tableau je odličan, ali ja već imam izvještajni sustav, te što će mi dodatni alat za BI?”. Istina, uvoditi nove alate uvijek uključuje dodatna financiranja, međutim Tableau nije izvještajni alat. Tableau je alat za analitiku i vizualizaciju podataka. Ostali alati imaju vizualizacijske mogućnosti (pite, bar chartovi), ali ne funkcioniraju na isti način. Tableau je namijenjen krajnim korisnicima i analize se rade ad-hoc, gdje se u realnom vremenu postavljaju neka poslovna pitanja poput: tko su moji najprofitabilniji kupci, gdje se nalaze, koje proizvode kupuju, koji se proizvodi u najbolje prodavane proizvode još kupuju. I tu dolazimo do zaključka, da standardni izvještajni sustavi nisu u mogućnosti da u realnom vremenu daju odgovore na ta pitanja. U današnjem poslovanju nije dovoljno samo imati podatke o prošlosti, poput koliko smo prodali prošle godine, mjesec, dan, nego na te odgovore moramo dati pitanje zašto je to tako, koji su uzroci tome i što možemo poduzeti.

market-basket-4

Ukoliko pogledamo gornju sliku, imamo klasičnu analizu potrošačke košarice gdje je vidljivo koji se kategorije proizvoda najviše prodaju jedna s drugom. Iskreno rečeno, ovakav tip analize u Tableau možemo napraviti u 10 – 15 min i to od strane poslovnog korisnika.

O Tableau kao proizvodu

Tableau je američka softverska tvrtka koja se bavi razvojem analitičkih alata, pa kad se kaže Tableau onda se najčešće misli  na Tableau Desktop tzv. PC inačicu koja je dostupna za Windows i Mac. Tu se obavlja najveći dio posla, od spajanja na podatke do analize, izrade dashboarda i spremanja na Tableau Server. Tableau Server je repozitorij (portal) analiza i dashboarda koji se rade na Tableau Desktopu. Uz Desktop i Server, postoji Tableau Online, cloud inačica Tableau Servera, Tableau Reader – besplatni čitač dashboarda koje smo izradili na Tableau Desktopu, Tableau Public – besplatni alat koji se može spajati na Excelice, csv i Access baze podataka i gdje podatke može spremati samo na Tableau Public server, gdje svi vaši podaci  i vizualizacije postaju vlasništvo Tableau-a, ali imate mogućnost dijeljenja analiza i vizualizacija sa svijetom. Tableau Public se najčešće koristi od strane blogera, novinara te sportskih i ekonomskih analitičara. Također, postoje Tableau iPad i Android mobilne aplikacije gdje se dashboardi i izvještajni mogu čitati s mobilnih uređaja (nema Flash-a :), koristi se HTML5 i JS )

Capture

Spajanje na izvore podataka

Ovo je jedan od najvećih aduta Tableau-a. Tableau Desktop ima mogućnost spajanja na skoro sve izvore podataka, od Excelica do svih SQL relacijskih baza (MS SQL, MySQL, PostgreSQL) te danas popularnih Big Data izvora (Hive, Imapala, Spark) ili podataka unutar cloud servisa poput Google Analyticsa. Ukoliko vašeg izvora nema na popisu te se podaci nalaze primjerice u XML ili JSON obliku, onda uvijek možete razviti Web Connector prema vašem izvoru. Tableau omogućuje developerima putem Tableau JS API-a da brzo pristupe podacima te  da ih otvore u Tableau. Kod pristupa podacima, nema pisanja niti jedne linije koda, jedino što korisnik treba znati je IP adresa servera i njegov username i password, a analiziranje Excelice se svodi na drag&drop Excel ikone u Tableau.

Capture

Tableau performanse

Kad pričamo o performansama i spajanje na izvore podataka, onda u Tableau možemo birati dva načina. Jedan od njih je live način spajanja gdje se Tableau direktno spaja na izvor (primjerice SQL baza podataka) te šalje SQL upite prema njoj u realnom vremenu. Tu performanse ovise o samom izvoru podataka, stoga ako vam baza nije optimizirana, indeksirana onda i Tableau neće davati znakove života. S druge strane imamo tzv. in-memory način koji se u Tableau zove extract. Extract je zapravo kompresirani set podataka koji se dohvaća iz izvorišnog sustava, kompresira i sprema u RAM memoriju te ima “columnar- storage” oblik. Sve ovo znači ukoliko imate neki pristojan set podataka koje RAM memorija PC-a/Servera može prihvatiti, onda će vam analiza podataka biti ubrzana nekoliko stotina puta. To ne znači da možemo cijeli Hadoop file od 3TB staviti u RAM i analizirati, jer jednostavno analiza postaje preskupa. Migracija s live-a na extract se radi pomoću jednog klika te je u svakom trenu moguće birati između ove dvije opcije.

Untitled

Vizualizacije podataka

Ovo je također područje u kojem Tableau briljira i tehnologija VizSQL kojom Tableau nastupa na tržištu odmiče daleko od konkurencije. Unutar Tableau Desktopa postoje ogroman broj vizualizacijskih oblika, koji prate najbolje prakse prema Tufte-u i Few-u. Stoga nema 3D grafova i ostalih kvazi vizualizacija, koje Excel korisnici vole stavljati unutar analiza. U donjoj vizualizaciji ću prezentirati neke od vrste grafova koje često susrećemo u Tableau:

    Integracija s web stranicama i aplikacijama Tableau vizualizacije se jednostavno implementiraju unutar web stranica, postavljanjem Javascript skripte unutar HTML-a koje nam Tableau generira. Također ukoliko imamo neke posebne zahtjeve, možemo koristiti Tableau JS API koji nam omogućuje neke nove stvari.   Tko uopće koristi Tableau Veliki je broj korisnika koji koriste Tableau za različite namjene. Puni popis nekih od korisnika se nalazi na ovom linku . Uglavnom korisnici dolazi iz različitih područja: prodaja, bankarstvo, telekomunikacija, gaming, osiguranja, edukacije, vladinih te neprofitnih organizacija. Tableau se koristi unutar različitih odjela te je odlično prihvaćen, među poslovnih korisnicima, jer im omogućuje interaktivnu analizu podataka. Ukoliko želite vidjeti nekoliko primjera primjene unutar odjela, onda je ovaj popis za vas. Zaključak Bili ljubitelji ili mrzitelji Tableau-a, moramo se pomiriti s činjenicom da Tableau daje novi i svjež način interakcije s podacima, što dokazuju sve veći broj korisnika koje ga koriste, Gartnerovi izvještaji, nove verzije proizvoda koje dolaze u rasponu od tri do šest mjeseci te odličan community. Ukoliko imate želju analizirati podatke unutar vašeg poduzeća ili odjela, Poslovna Inteligencija će vam biti spremna pomoći u tome. Za kraj imamo vizualizaciju za vas. Ovo je primjer koji pokazuje snagu Tableau proizvoda. Riječ je o analizi kriminala u Philadelphiji (SAD), koji sadrži zapise o svakodnevnim tipovima kriminala. Veličina dataseta je oko milijun redaka, dataset je u extractu (in-memory) te je veličina baze oko 8 megabajta. Vizualizaciju možete besplatno preuzeti te analizirati na vlastitom računalu.

 

Tags