Big Data and Big Analytics

Volgens onderzoekers bij onder meer IBM waren er op het einde van het vorig millennium, 800.000 petabytes aan gegevens opgeslagen in informatiesystemen. Eén petabyte staat voor 1015 bytes dit is een één met 15 nullen erachter. Twitter genereerde vorig jaar alleen al 7 terabytes per dag en Facebook 10 terabytes per dag, een terabyte is 1012. De dood van Bin Laden in 2011 genereerde 5106 Tweets per seconde. De aardbeving in Fukushima was goed voor 6939 Tweets per seconde.

Volgens dezelfde onderzoekers zullen er tegen 2020, 35 zetabytes aan gegevens zijn opgeslagen. Eén zetabyte staat voor 1021 dit is een één met 21 nullen. Het komt de duur niet op een nul meer of minder. Dit zijn astronomische hoeveelheden aan gegevens die ons voorstellingsvermogen overstijgen.

We spreken op vandaag terecht van Big Data. 80% van deze gegevens is helaas niet gestructureerd, het is te zeggen zomaar niet om te zetten tot informatie of kennis, zonder aangepaste software of algoritmes.  Voor bedrijven stijgt de hoeveelheid beschikbare data exponentieel, maar tezelfdertijd daalt de capaciteit van bedrijven om deze data te kunnen verwerken ook exponentieel!

Bedrijven kampen op vandaag zelfs voornamelijk met het kleinere aandeel, de 20%  gestructureerde gegevens. Dit zijn gegevens die ogenschijnlijk netjes opgeslagen zijn in tabellen en aldus potentieel gerelateerd zijn met elkaar. Toch zijn ook deze gegevens niet altijd vlot om te zetten tot informatie of kennis, waarop er beslissingen kunnen genomen worden.  Voor de CIO geen gemakkelijk opdracht om uit deze ruwe diamant mooie geslepen juwelen te slijpen!

Volgens Gartner kijken vele bedrijfsleiders nog te veel naar de bestaande ERP systemen die het probleem van financiële software zullen oplossen. Was dit trouwens niet het USP van een ERP systeem? Samen brengen van alle bedrijfsgegevens in één centrale repository? Helaas mankeren deze systemen meestal het analytische vernuft die op vandaag vereist wordt om alsmaar complexere informatiesets te kunnen aanleveren. De spreadsheet inschakelen zoals dit maar al te vaak gebeurt is echt geen goede oplossing omdat ook hier op termijn de nodige ondersteuning dreigt te kort te schieten.

Tenslotte is er de vaststelling, nog volgens Gartner, dat ‘business analytics’ complexe materie is dat verduiveld moeilijk te begrijpen is voor de meeste IT-ers. De CIO en BI-analisten zullen meer en meer een sterke zakelijke backgrond nodig hebben zodat ze de gepaste tools kunnen inschakelen om de behoeften van de bedrijfsleiding te kunnen invullen.

jan devos

Advertisements

About jangdevos
I'm an IT/IS professor, a late Baby Boomer, married with Ann and father of Hélène and Willem, a Stones fan and interested in almost everything. I work at the UGent (campus Kortrijk), Belgium. My research domain are: IT Governance in SMEs, IT/IS Security, IT Management, IT Project Management, IT Trends and IT/IS failures.

One Response to Big Data and Big Analytics

  1. Ann K-Vdg says:

    Ik denk dat duplicatie van informatie en de tegenstrijdigheid van gegevens een van de grootste problemen in de gestructureerde gegevens uitmaakt… IT hinkt de processen achterna. Vele medewerkers hebben vaak hun eigen processen (zoals je zegt eventueel door het gebruik van een spreadsheet, of eventueel een Access-DB) en die zijn vaak de dood om een mooi geslepen diamant te verkrijgen. Mensen geven informatie in, en dit veel te dikwijls fout…

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: