Die Grafik illustriert die Zahalen 10 und 01, auf grünen Pixeln.© C. Beer

Big Data – Chan­cen und Ri­si­ken der Mas­sen­da­ten

von viel.-Re­dak­ti­on

Als der Ex-NSA-Mit­ar­bei­ter Ed­ward Snow­den im Som­mer 2013 pi­kan­te In­for­ma­tio­nen zur flä­chen­de­cken­den Über­wa­chung welt­wei­ter In­ter­net­kom­mu­ni­ka­ti­on durch Ge­heim­diens­te ent­hüllt, löst er damit einen Skan­dal aus. Über Nacht wird der Be­griff Big Data zum Syn­onym für etwas Ne­ga­ti­ves wie den Ver­lust von Pri­vat­sphä­re. Miss­trau­en in­ner­halb der Be­völ­ke­rung macht sich breit. In Zei­ten der ra­sant vor­an­schrei­ten­den di­gi­ta­len Trans­for­ma­ti­on weicht die Gren­ze zwi­schen In­ti­mi­tät und Öf­fent­lich­keit durch die Da­ten­er­fas­sung immer wei­ter auf. Die Schat­ten­sei­ten von Big Data sind klar zu er­ken­nen, zi­vi­li­sa­to­ri­scher Fort­schritt und enor­me Po­ten­zia­le sind den­noch nicht von der Hand zu wei­sen, wie Prof. Dr. Jens Lüs­sem und Prof. Dr. Nils Grusch­ka vom Fach­be­reich In­for­ma­tik und Elek­tro­tech­nik der Fach­hoch­schu­le Kiel Laura Berndt er­klär­ten.

Laura Berndt (LB): Was be­deu­tet Big Data?

 

Jens Lüs­sem (JL): Der Be­griff steht für einen Ge­samt­pro­zess, näm­lich die Ent­ste­hung gro­ßer, kom­ple­xer Da­ten­men­gen, ihre Spei­che­rung, spä­te­re Ana­ly­se sowie ihre ziel­ori­en­tier­te Ver­wer­tung. Die kon­ti­nu­ier­li­che Di­gi­ta­li­sie­rung un­se­rer Ge­sell­schaft führt zu einem wach­sen­den Da­ten­vo­lu­men, das sich alle zwei Jahre ver­dop­pelt, Ten­denz stei­gend. Meh­re­re Mil­lio­nen E-Mails pro Se­kun­de und Mil­li­ar­den von Such­auf­trä­gen bei Goog­le pro Tag stel­len nur einen Bruch­teil der Daten dar, die Pri­vat­per­so­nen und Un­ter­neh­men täg­lich pro­du­zie­ren.

LB: Was pas­siert mit den Mas­sen­da­ten nach ihrer Ent­ste­hung?

Nils Grusch­ka (NG): Un­ter­neh­men, die Daten ge­ne­rie­ren, spei­chern diese zu­nächst in rie­si­gen Da­ten­bank­sys­te­men de­zen­tral, also auf un­zäh­li­gen Rech­nern. Ver­teil­te Ap­pli­ka­tio­nen er­mög­li­chen dann den schnel­len Zu­griff auf ge­wünsch­te In­for­ma­tio­nen. Bei der an­schlie­ßen­den Ana­ly­se, dem Data-Mi­ning, er­mög­li­chen es In­for­ma­tik- und Sta­tis­tik­ver­fah­ren, neue, wert­vol­le Mus­ter aus den vor­han­de­nen Daten ab­zu­le­sen. Mit so­ge­nann­ten Ma­p­Re­du­ce-Ver­fah­ren kön­nen An­wen­de­rin­nen und An­wen­der seit ei­ni­ger Zeit sogar An­fra­gen par­al­le­li­sie­ren und auf meh­re­re Rech­ner ver­tei­len, von denen sie gleich­zei­tig eine Ant­wort er­hal­ten. Auf diese Weise las­sen sich po­ten­ti­ell nütz­li­che Re­gel­mä­ßig­kei­ten und Zu­sam­men­hän­ge quasi in Echt­zeit be­stim­men, zum Bei­spiel Stau­vor­her­sa­gen.

LB: Wer pro­fi­tiert von Big Data?

JL: In der Regel alle, die einen Nut­zen aus den Daten und ihrer Wei­ter­ver­ar­bei­tung zie­hen. Dabei reicht das Spek­trum von Ge­heim­diens­ten über So­ci­al-Media-Un­ter­neh­men bis hin zu gro­ßen Kon­zer­nen. Auf­ge­zeich­ne­te Kun­den­da­ten und -struk­tu­ren ge­hö­ren für Ver­triebs- und Mar­ke­ting­ab­tei­lun­gen zu den be­lieb­tes­ten In­for­ma­tio­nen, denn durch sie las­sen sich Ge­schäfts­mo­del­le an­pas­sen und Leis­tun­gen op­ti­mie­ren. Kun­den­schnitt­stel­len wer­den durch Ana­ly­sen mit­tels Big Data be­dien- und ge­stalt­bar. Von der Ab­hän­gig­keit des Un­ter­neh­mens von Kun­din­nen und Kun­den und um­ge­kehrt pro­fi­tie­ren wie­der­um In­ter­me­diä­re, also Zwi­schen­glie­der wie Goog­le, die einen Markt­platz an­bie­ten, auf dem per­so­na­li­sier­te Wer­bung ge­schal­tet wird.

LB: Das ame­ri­ka­ni­sche IT-For­schungs­in­sti­tut Gart­ner Inc. be­zeich­net Big Data als Öl des 21. Jahr­hun­derts. Stim­men Sie dem zu?

JL: De­fi­ni­tiv! Wir spre­chen der­zeit von einer Di­gi­ta­li­sie­rung oder Vir­tua­li­sie­rung der Welt. Immer mehr Ge­schäfts­mo­del­le fußen auf Daten. Die­ser Roh­stoff scheint un­end­lich zu sein und wird erst durch eine nutz- und ge­winn­brin­gen­de Ana­ly­se zu einem kost­ba­ren Gut. Ob Smart­pho­ne, On­line-Shop­ping oder Kre­dit­kar­ten­zah­lung, über­all im All­tag pro­du­zie­ren wir Daten und hin­ter­las­sen Spu­ren.

NG: Ent­zie­hen kön­nen wir uns die­ser Ent­wick­lung kaum noch, und wenn dann geht die­ser Schritt mit Kom­fort­ver­lust ein­her. Für die einen be­deu­tet das, läs­ti­ges Kar­ten­le­sen statt ent­spann­ter Na­vi­ga­ti­ons­sys­tem­füh­rung, für an­de­re wie­der­um das um­ständ­li­che­re Kon­tak­tie­ren von Be­kann­ten per Te­le­fon an­stel­le einer schnel­len Whats­App-Nach­richt. Tech­ni­scher Kom­fort zum Preis des Pri­vat­sphä­ren­ver­lusts – die­sen Kom­pro­miss geht fast jeder Mensch heut­zu­ta­ge ein.

LB: Wel­che Ri­si­ken birgt Big Data?

NG: Die Spei­che­rung und Aus­wer­tung von Daten birgt immer auch Ge­fah­ren. Jede In­for­ma­ti­on, die wir preis­ge­ben, macht uns trans­pa­ren­ter. Zwar ver­spre­chen Un­ter­neh­men den si­che­ren Um­gang mit un­se­ren Daten, si­cher kön­nen wir je­doch nicht sein. GPS-fä­hi­ge Han­dys, so­zia­le Netz­wer­ke und mit Ka­me­ra­sys­te­men aus­ge­stat­te­te Gro­ß­städ­te sind nur ei­ni­ge Bei­spiel dafür, dass Be­we­gungs- und Per­so­nen­pro­fi­le von uns an­ge­fer­tigt wer­den. Dar­über hin­aus wer­den immer mehr Daten so auf­ge­zeich­net, dass wir es gar nicht mit­be­kom­men. Au­ßer­dem be­steht die Ge­fahr der Ma­ni­pu­la­ti­on – den­ken wir nur ein­mal an per­so­na­li­sier­te Wer­bung bei Goog­le, die unser Kauf­ver­hal­ten len­ken soll. Eine große Ge­fahr von Big Data ist die Mög­lich­keit, mit Daten Geld zu ver­die­nen. Das In­ter­es­se an mehr Pro­fit und dem­nach mehr In­for­ma­tio­nen wird in un­se­rer Ge­sell­schaft daher nicht sin­ken.

LB: Aber Big Data er­öff­net doch be­stimmt auch Chan­cen und Mög­lich­kei­ten?

JL: Si­cher. Big Data re­vo­lu­tio­niert die Be­rufs­land­schaft, schafft neue Tä­tig­keits­fel­der und Jobs, vor allem im IT-Sek­tor. Dazu zäh­len unter an­de­rem Da­ten­in­ge­nieu­rin­nen und –in­ge­nieu­re, die für Hard- und Soft­ware sowie Netz­kom­po­nen­ten zu­stän­dig sind, und Data Sci­en­tists, die Roh­da­ten und Ana­ly­se­for­men be­stim­men, um ein ge­wünsch­tes Er­geb­nis zu er­zie­len. Neue Wirt­schafts­zwei­ge wie Smart Grid, das heißt die Ent­wick­lung in­tel­li­gen­ter En­er­gie­sys­te­me, die einen ent­schei­den­den Schritt auf dem Weg zu mehr Nach­hal­tig­keit dar­stel­len, und In­dus­trie 4.0, eine Ver­net­zung von IT und Kom­mu­ni­ka­ti­ons­tech­nik mit der in­dus­tri­el­len Fer­ti­gung, wer­den un­se­re Ge­sell­schaft ver­än­dern. Big Data er­mög­licht au­ßer­dem ge­naue­re Vor­her­sa­gen, bei­spiels­wei­se in den Be­rei­chen Erd­be­ben­for­schung und Seu­chen­vor­beu­gung. So konn­te Goog­le be­reits auf­grund ge­häuf­ter Such­an­fra­gen zu Me­di­ka­men­ten und Sym­pto­men Grip­pe­wel­len vor­her­sa­gen und war den amt­li­chen Mel­de­sta­tis­ti­ken damit zeit­lich vor­aus. Frü­hes Vor­war­nen kann an die­ser Stel­le auch Men­schen­le­ben ret­ten.

LB: Wie ist Da­ten­schutz in Zei­ten von Big Data mög­lich?

NG: Ein schwie­ri­ges Thema. Wenn Goog­le nur wüss­te, wo­nach wir su­chen, wäre das noch harm­los. Zu­sätz­lich weiß das Un­ter­neh­men je­doch auch, von wem wir E-Mails be­kom­men und wo wir uns be­we­gen, da es ver­schie­de­ne Leis­tun­gen an­bie­tet, wie Goog­le Mail und Maps. Die Ver­knüp­fung die­ser Daten ist das Pro­blem. Un­ter­neh­men soll­ten zu­nächst schon aus ei­ge­nem In­ter­es­se und im Sinne ihrer Kun­din­nen und Kun­den ver­ant­wor­tungs­voll mit den In­for­ma­tio­nen um­ge­hen. Dar­über hin­aus muss der Ge­setz­ge­ber Rah­men­be­din­gun­gen schaf­fen, das heißt den Un­ter­neh­men vor­schrei­ben, dass sie diese nicht mit an­de­ren aus­tau­schen und mög­lichst früh an­ony­mi­sie­ren. Jedes ge­spei­cher­te Datum ist ein po­ten­zi­el­les Ri­si­ko. Da­ten­schüt­ze­rin­nen und -schüt­zer raten daher zu Da­ten­spar­sam­keit: Das heißt so viel wie nötig spei­chern, um an­schlie­ßend noch sinn­vol­le Ana­ly­sen ma­chen zu kön­nen, aber so wenig wie mög­lich spei­chern, um die Pri­vat­sphä­re eines jeden Men­schen nicht zu ge­fähr­den. In Eu­ro­pa pas­siert auf die­sem Ge­biet schon mehr als in den USA, aber das Bun­des­da­ten­schutz­ge­setz muss wei­ter aus­ge­baut wer­den.

LB: Die Si­cher­heit, dass ein Un­ter­neh­men ver­trau­ens­wür­dig mit un­se­ren Daten um­geht, gibt es nicht. Wie kön­nen Pri­vat­per­so­nen ihre In­for­ma­tio­nen also vor­beu­gend schüt­zen?

NG: Ge­sun­des Miss­trau­en ist zu­nächst rat­sam, soll­te aber nicht in Tech­no­lo­gie­feind­lich­keit aus­ar­ten. Jeder Mensch muss genau über­le­gen, was er von sich preis­ge­ben möch­te und sich dem Sys­tem not­falls ent­zie­hen. Um si­cher­zu­ge­hen, dass ge­wis­se Daten nicht auf­ge­zeich­net wer­den, soll­ten wir eher lokal ein­kau­fen und bar zah­len als on­line mit Kre­dit­kar­te zu shop­pen. Wer nicht möch­te, dass bei Whats­App mit­ge­le­sen wird, braucht eine Mes­sen­ger-App mit Ende-zu-Ende-Ver­schlüs­se­lung wie zum Bei­spiel Su­re­s­pot oder Th­ree­ma. Auch zur Such­ma­schi­ne Goog­le gibt es si­che­re­re Ge­gen­bei­spie­le wie Me­ta­Ger.de, Duck­Duck­Go.com oder Start­pa­ge.com. An Al­ter­na­ti­ven man­gelt es nicht, sie sind nur oft­mals we­ni­ger nut­zer­freund­lich oder teu­rer. Wer mehr Pri­vat­sphä­re möch­te, muss hin und wie­der einen Kom­pro­miss ein­ge­hen, und wem das wich­tig ist, dem fällt die­ser Schritt nicht schwer.

© Fach­hoch­schu­le Kiel