Blog

Kako analizirati podatke u odjelu ljudskih resursa? Studija slučaja predviđanja odlazaka koristeći IBM Watson Analytics

Autor: Hrvoje Gabelica

Podaci iz dana u dan postaju “crno zlato” i dolazi do trenda korištenja analitičkih alata u svim odjelima svake organizacije. Noćna mora svakog odjela za ljudske resurse je utvrđivanje zašto ljudi masivno odlaze iz tvrtke i postoji li neki konkretan uzorak među podacima koji to mogu dokazati.

Tema ovog članka je upravo to: mogu li se podaci iskoristiti za predviđanje odlazaka ljudskih potencijala iz tvrtke?

Kao analitički alat ovaj put sam izabrao IBM Watson Analytics, cloud rješenje s kojim možete brzo vizualizirati podatke i raditi prediktivnu analitiku. Bazu podataka koju sam odabrao je “Human Resources Analytics” sa Kaggle-a, tako da su sami podaci simulirani i nisu realni. Podatke i vi možete skinuti i koristiti ih za vaše potrebe.

Struktura podataka

Sami podaci su relativno jednostavni. Set podataka se sastoji od 15 tisuća redaka i 10 stupaca. Stupci opisuju:

  • Employee satisfaction level – zadovoljstvo zaposlenika (0 – 1)
  • Last evaluation
  • Number of projects
  • Average monthly hours
  • Time spent at the company
  • Whether they have had a work accident (Da – Ne)
  • Whether they have had a promotion in the last 5 years (Da – Ne)
  • Department
  • Salary
  • Whether the employee has left (Da – Ne)

Slika 1. Izgled Refine modula unutar IBM Watson Analytics

 

Podatke je prije analize trebalo urediti, jer analitički algoritmi ne reagiraju kvalitetno ukoliko postoji loša kvaliteta podataka. IBM Watson Analytics ima mogućnost jednostavne pripreme podataka dovoljno da se podaci dovedu u stanje analize.

Istraživanje podataka

Prije same analize podataka, bitno je imati dobro pitanje kako bi dali dobar odgovor uz pomoć podataka. IBM Watson Analytics ima ugrađen algoritam koji iz napisanog pitanja može napraviti jednostavnu vizualizaciju podataka. Primjerice ukoliko upišete pitanje poput “What is relationship between timespend company and average monthly hours by department” dobiti ćete vizualizaciju u obliku dijagrama rasipanja.

Slika 2. Vizualizacija generirana iz pitanja

Kad počinjemo za analizom podataka uvijek postavimo jednostavno pitanje koje nam daje široku sliku. Primjerice želimo saznati da li ljudi koji nisu promovirani zadnjih 5 godina značajno odlaze iz tvrtke.

Kao što vidimo iz podataka primjerice zanimljivo je da 24.7%  zaposlenika koji su promovirani zadnjih 5 godina su otišli iz tvrtke, što nije slučaj kod zaposlenika koji nisu promovirani.

Nadalje ako želimo saznati jesu li ljudi odlazili zbog mjesečnog satnog opterećenja na radnom mjestu u odnosu na razinu plaće, možemo napraviti jednostavan stupičasti grafikon koji nam daje jasnu sliku.

Iz grafa možemo vidjeti da zaposlenici koji imaju malu i srednju razinu plaće i imaju veći broj mjesečnih radnih sati ćešće odlaze iz tvrtke.

U dosta slučajeva možemo vidjeti da ljudi koji koriste alate za vizualizaciju podataka imaju tedenciju pitati koje napredne vizualizacije možemo koristiti u data discovery fazi . U većini svojih projekata pitanja se mogu odgovoriti sa jednostavnim vizualizacijama.

Primjerice vizualizacija u donjoj slici nam daje jasnu sliku o tome koji ljudi najčešće odlaze iz tvrtke. U ovom slučaju to su zaposlenici koji rade 3-6 godina, što možemo smatrati prihvatljivim, jer u današnje vrijeme sve više dolazi do migracija unutar tvrtke.

Izrada dashboarda

Nakon što smo napravili sve vizualizacije, bitno ih je sve povezati kako bi mogli imati cjelokupno saznanje na jednom mjestu. Unutar Watson Analytics alata postoji mogućnosti izrade dashboarda u kojem možemo cijelu priču automatizirati i postavljati nova pitanja. Primjerice ako želimo filtrirati po varijabli nesereća na poslu ili raspon plaće možemo ih jednostavno dodati i postavljati još više pitanja.

Nepisani zakon kod dashboarda jest da sve mora biti pregledno i informativno, jer ako čovjek ne može izvući konkretne informacije onda cijela analiza postaje besmislena.

Prediktivna analitika

Ovaj dio unutar IBM Watson Analyticsa je najzanimljviji, jer je IBM napravio jako dobar posao integrirajući svoje algoritme za predikitvnu analitiku iz svoje data science platforme. Inače IBM je proglašen Gartnerovim liderom zadnjih nekoliko godina unutar data science platformi i nije ni čudo da su ovakve stvari jako dobro izveli.

Zasada IBM Watson Analytics podržava dvije vrste prediktivne analize. Prva je tzv. Spiral analiza gdje Watson Analytics sam predviđa koja kombinacija varijabli ima najveći utjecaj na nezavisnu varijablu u ovom slučaju odlazak zaposlenika. U donjoj slici vidimo da su varijable koliko je vremena zaposlenik proveo u tvrtki i kolika je razina zadovoljstva imale najveći utjecaj na odlazak zaposlenika. Nakon što odaberemo određenu kombinaciju, možemo ući u detaljniju analizu koje su točno vrijednosti unutar pojedine varijable imale najveći utjecaj.

Drugi oblik prediktivne analize je u obliku stabla odlučivanja odnosno IF-THEN-ELSE logika. U ovom slučaju nam Watson Analytics daje dvije vizualizacije, prva koja pravila koja nam daju najbolje rezultate i drugu koja je klasični prikaz stabla odlučivanja. Jedan primjer takve vizualizacije se nalazi na donjoj slici gdje vidimo da se stvorilo pravilo koje kaže ako je razina zadovoljstva manja od 0.4 i broj projekata veći od 5 i prosječan broj mjesečnih sati rada veći od 253 onda imamo najviše odlazaka.

Ovaj funkcionalnost IBM Watson Analyticsa je odlična, jer se automatski mogu prepoznati međuovisnosti među varijablama koje ne bi mogli vizualizirati podacima.

Zaključak

IBM Watson Analytics kao analitička cloud platforma pruža odlično sandbox okruženje za sve poslovne korisnike koje žele na brz i jednostavan način istražiti svoje podatke te svoja saznanja implementirati unutar poslovanja.

Tags