• Über WordPress
    • WordPress.org
    • Dokumentation
    • Support
    • Feedback
  • Anmelden
  • Unsere Angebote

    Online-Kurse

    • BFP Begleitkurs Digital
    • Big Data Literacy
    • Digital gegen Antisemitismus
    • eTeaching Expert
    • EOP Begleitkurs Digital
    • Facharbeit schreiben
    • Praxissemester Digital
    • Veränderung in der Schule bewirken
    • Visionsentwicklung

    Lernmodule

    • Bildungschancen
    • Coaching und Beratung
    • Digitale Lernmaterialien
    • Diversität
    • Sonderpäd. Materialien
    • Methoden
    Teaser für die Fortbildung eTeaching Expert

    eTeaching Expert

    Das Schul­netz­werk im ZfL hat eine kos­ten­freie Fort­bil­dung zum eTea­ching Expert kon­zi­piert, die einen Online-Kurs und einen Blog mit eTea­ching ‑Impu­len beinhaltet.

    Weiterlesen

  • Zum ZfL
Digitale Lehre
  • Unsere Angebote

    Online-Kurse

    • BFP Begleitkurs Digital
    • Big Data Literacy
    • Digital gegen Antisemitismus
    • eTeaching Expert
    • EOP Begleitkurs Digital
    • Facharbeit schreiben
    • Praxissemester Digital
    • Veränderung in der Schule bewirken
    • Visionsentwicklung

    Lernmodule

    • Bildungschancen
    • Coaching und Beratung
    • Digitale Lernmaterialien
    • Diversität
    • Sonderpäd. Materialien
    • Methoden
    Teaser für die Fortbildung eTeaching Expert

    eTeaching Expert

    Das Schul­netz­werk im ZfL hat eine kos­ten­freie Fort­bil­dung zum eTea­ching Expert kon­zi­piert, die einen Online-Kurs und einen Blog mit eTea­ching ‑Impu­len beinhaltet.

    Weiterlesen

  • Zum ZfL

Was ist „Big Data”?

Startseite » Big Data Literacy » Was ist „Big Data”?

Was ist „Big Data”?

Hintergrundbild zum Online-Kurs Big Data Literacy

Eine ein­deu­ti­ge und fest­ste­hen­de Defi­ni­ti­on des Begriffs „Big Data” gibt es nicht, wohl aber tei­len sich vie­le Begriffs­klä­run­gen eine oder meh­re­re Aus­sa­gen in Bezug auf die Men­ge, die Struk­tu­riert­heit und die ange­wen­de­ten Tech­no­lo­gien zur Aus­wer­tung digi­ta­ler Daten.1

Big Data setzt leis­tungs­fä­hi­ge Spei­cher­me­di­en vor­aus, um kon­ti­nu­ier­lich digi­ta­le Daten zu sam­meln und mit­hil­fe von Algo­rith­men und Maschi­nen Ler­nen aus­zu­wer­ten. Big Data und dadurch mög­li­chen Ana­ly­sen (Big Data Ana­ly­tics) sind eine Fol­ge der digi­ta­len Trans­for­ma­ti­on unse­rer Gesell­schaft, der expo­nen­ti­ell gestie­ge­nen Kapa­zi­tät von Spei­cher­tech­no­lo­gien und der eben­falls gestie­ge­nen Leis­tungs­fä­hig­keit von Pro­zes­so­ren und Algorithmen.

  • Big Data aus einer medi­en­wis­sen­schaft­li­chen Sicht — Sam­mel­be­griff für tech­ni­sche Ver­fah­ren zur Erfas­sung, Spei­che­rung und Ana­ly­se viel­fäl­ti­ger und sehr gro­ßer digi­ta­ler Daten­men­gen. Ver­weist außer­dem auf uto­pi­sche sowie dys­to­pi­sche Rhe­to­ri­ken zur Aus­wer­tung gro­ßer Datensätze.

Wei­te­re Infor­ma­tio­nen zu Big Data aus einer infor­ma­ti­schen Sicht:

  • Big Data (Lexi­kon­ein­trag)

1. „V“-Begriffe

Häu­fig in der Lite­ra­tur zitiert wird die Cha­rak­te­ri­sie­rung von Big Data über eng­lisch­spra­chi­ge „V“-Begriffe.2, 3

Dem­nach zeich­net sich Big Data aus durch: „Volu­me“, „Velo­ci­ty“ und „Varie­ty“.

Gra­fi­sche Auf­ar­bei­tung des V‑Modell für Big Data nach Klein, Tran-Gia & Hart­mann (2013)4: I AG Digi­tale­Leh­re des ZfL der Uni­ver­si­tät zu Köln (https://​zfl​.uni​-koeln​.de/) I CC BY SA 4.0 (https://​crea​ti​vecom​mons​.org/​l​i​c​e​n​s​e​s​/​by- sa/4.0/)

Big Data – Erklär­film – Das knapp drei Minu­ten lan­ge Erklär­vi­deo von exp­lain-it zu Big Data aus dem Jahr 2014 erläu­tert den Begriff, die Ent­ste­hung von Daten sowie Anwendungsbeispiele. 

Foto: Mar­kus Spi­ske von Unsplash

Unter­richts­ein­heit „Was ist Big Data?“  — Die­se Ein­heit nimmt 45 Minu­ten in Anspruch und rich­tet sich an Schü­le­rin­nen und Schü­ler im Alter von 12 bis 16 Jah­ren an Gym­na­si­en, Real- und Haupt­schu­len. Es wird der Begriff „Big Data“ ein­ge­führt und erklärt, wie und wel­che Men­gen an Daten im All­tag pro­du­ziert wer­den. Die Mate­ria­li­en ste­hen zum Down­load zur Ver­fü­gung. Die „Digi­ta­le Lern­werk­statt” ist ein Pro­jekt der Accen­ture Dienst­leis­tun­gen GmbH.

Pho­to by Ste­phen Daw­son on Unsplash

2. Arbeitsdefinition des Deutschen Ethikrats

In sei­ner im Novem­ber 2017 ver­öf­fent­lich­ten Stel­lung­nah­me zu Big Data im Gesund­heits­we­sen legt der Deut­sche Ethik­rat fol­gen­de Arbeits­de­fi­ni­ti­on zugrunde:

„Big Data ist der Umgang mit gro­ßen Daten­men­gen, der dar­auf abzielt, Mus­ter zu erken­nen und dar­aus neue Ein­sich­ten zu gewin­nen, und der hier­zu ange­sichts der Fül­le und Viel­falt der Daten sowie der Geschwin­dig­keit, mit der sie erfasst, ana­ly­siert und neu ver­knüpft wer­den, inno­va­ti­ve, kon­ti­nu­ier­lich wei­ter­ent­wi­ckel­te infor­ma­ti­ons­tech­no­lo­gi­sche Ansät­ze nutzt.” 5

Im Fol­gen­den ste­hen nicht die infor­ma­tisch-tech­ni­schen Bear­bei­tun­gen von Big Data im Vor­der­grund, son­dern die gesell­schaft­lich-kul­tu­rel­len Aus­wir­kun­gen und sozia­len Fol­gen, die sich durch die Aus­wer­tung von Big Data erge­ben. Big Data bezeich­net nicht nur das blo­ße Vor­han­den­sein gigan­ti­scher und hete­ro­ge­ner Daten­be­stän­de, son­dern schließt auch ihre Aus­wer­tung mit Hil­fe von Künst­li­cher Intel­li­genz und Maschi­nel­les Ler­nen ein.

Die visu­el­le Ein­füh­rung ins Maschi­nel­le Ler­nen von R2D3 zeigt, wie Com­pu­ter sta­tis­ti­sche Lern­ver­fah­ren anwen­den, um auto­ma­tisch Mus­ter in Daten zu erken­nen. Dies ermög­licht sehr genaue Vor­her­sa­gen zu tref­fen. Bei­spiel­haft wer­den die­se Ver­fah­ren anhand von Daten aus dem Immo­bi­li­en­markt dyna­misch veranschaulicht.

Foto: Mar­kus Wink­ler von Unsplash

3. Muster und Vorhersagen im Datenüberschuss

Big Data (Ana­ly­tics) erwei­tert die Mög­lich­kei­ten zur Erzeu­gung und Aus­wer­tung von Daten über die Welt. Für Vik­tor May­er-Schön­ber­ger ist Big Data „weni­ger eine neue Tech­no­lo­gie denn eine neue oder jeden­falls signi­fi­kant ver­bes­ser­te Metho­de der Erkennt­nis­ge­win­nung”.6 Es geht bei Big Data „nicht um die abso­lu­te Zahl an Daten”, son­dern um die Vor­ge­hens­wei­se rela­tiv zum Phä­no­men bzw. zur Fra­ge, die beant­wor­tet wer­den soll, „deut­lich mehr Daten” zu sam­meln und aus­zu­wer­ten.7

Die­ser Daten­über­schuss bie­tet Mög­lich­kei­ten, bis­lang uner­kann­te Mus­ter und sta­tis­ti­sche Kor­re­la­tio­nen als Ant­wor­ten auf Fra­gen zukünf­ti­gen Han­delns zu erzeu­gen. Je nach Fra­ge­stel­lung wur­den ver­schie­de­ne Anwen­dun­gen ent­wi­ckelt, die auch „prä­dik­ti­ve Ana­ly­tik” bezeich­net werden:

  • Wel­che Mit­ar­bei­te­rin steht kurz davor, selbst zu kün­di­gen? – Peop­le Analytics
  • Wo könn­te die nächs­te Straf­tat pas­sie­ren? – Pre­dic­ti­ve Policing
  • Wel­ches Pro­dukt wird die Kun­din als nächs­tes kau­fen? – Pre­dic­ti­ve Marketing
  • Wel­ches Bau­teil wird in den kom­men­den Tagen kaputt­ge­hen und muss jetzt aus­ge­tauscht wer­den? – Pre­dic­ti­ve Maintainance
  • Wel­ches Kind ist durch Gewalt in der Fami­lie akut gefähr­det? – Risk Sco­ring
  • Wel­che Stu­den­tin wird die Prü­fung nicht bestehen? – Lear­ning Analytics

Zur Beant­wor­tung der­ar­ti­ger Fra­ge­stel­lun­gen wer­den Big Data Tech­no­lo­gien ein­ge­setzt, um ver­meint­lich „neu­tra­le” Ant­wor­ten auf  Basis „objek­ti­ver Daten” zu lie­fern. Die Zuschrei­bun­gen von Neu­tra­li­tät, Objek­ti­vi­tät und somit Ratio­na­li­tät mit Blick auf die sozia­len Fol­gen wur­den indes wie­der­holt in Fra­ge gestellt.

Was ist „prä­dik­ti­ve Analytik”?

„In der „prä­dik­ti­ven Ana­ly­tik“ möch­te man also anhand leicht zugäng­li­cher Daten schwer zugäng­li­che Daten über Indi­vi­du­en abschät­zen. Prä­dik­ti­ve Ana­ly­tik ent­steht über­all dort, wo durch all­täg­lich ver­wen­de­te digi­ta­le Medi­en mas­sen­wei­se Ver­hal­tens- und Nut­zungs­da­ten anfal­len. Das liegt dar­an, dass prä­dik­ti­ve Model­le den ein­zel­nen Fall anhand von „pat­tern matching“ [dt. Mus­ter­ab­gleich oder mus­ter­ba­sier­te Suche] mit Mil­lio­nen ande­rer Fäl­le abglei­chen, ihn einer algo­rith­misch bestimm­ten Grup­pe beson­ders ähn­li­cher Fäl­le zuord­nen und dar­aus eine Schät­zung der unbe­kann­ten Ziel­va­ria­ble ableiten.
In den meis­ten Fäl­len wer­den sol­che Model­le mit Ver­fah­ren des über­wach­ten Ler­nens trai­niert: Dazu wird eine gro­ße Men­ge sog. „Trai­nings­da­ten“ benö­tigt, ein Daten­satz, in dem für eine Kohor­te von Indi­vi­du­en bei­de Daten­fel­der, also sowohl die Hilfs­da­ten als auch die sen­si­blen Ziel­da­ten, erfasst sind. Sol­che Daten­sät­ze fal­len regel­mä­ßig im Kon­text sozia­ler All­tags­me­di­en an, zum Bei­spiel pro­du­ziert die Teil­men­ge aller Facebook-Nutzer*innen, die in ihrem Pro­fl expli­zit Anga­ben über ihre sexu­el­le Ori­en­tie­rung machen, einen Trai­nings­da­ten­satz zur Abschät­zung der sexu­el­len Iden­ti­tät; und die Grup­pe der Indi­vi­du­en, von denen man gleich­zei­tig Zugriff auf ihren Brow­ser­ver­lauf und die Daten einer Gesund­heits-App hat, pro­du­zie­ren Trai­nings­da­ten für eine KI, die anhand von Brow­ser­ver­läu­fen Krank­heits­dis­po­si­tio­nen abzu­schät­zen ler­nen kann.
Sobald eine Grup­pe von eini­gen Tau­send Indi­vi­du­en frei­wil­lig oder unwis­sent­lich zugleich Hilfs­da­ten und sen­si­ble Daten preis­gibt, kann ein Machi­ne-Lear­ning-Modell trai­niert wer­den, wel­ches Kor­re­la­tio­nen zwi­schen den Hilfs­da­ten und den sen­si­blen Daten ermit­telt. Sol­che Model­le wer­den anschlie­ßend dazu ver­wen­det, die sen­si­ble Ziel­va­ria­ble auch für Indi­vi­du­en abzu­schät­zen, über die nur die Hilfs­da­ten bekannt sind und die selbst kei­ne sen­si­blen Daten über sich preis­ge­ben wür­den.“8

Quel­len

 

1 Vgl. Ward, J. S. & Bar­ker, A. (2013, 20 Sep­tem­ber). Unde­fi­ned By Data: A Sur­vey of Big Data Defi­ni­ti­ons. Abge­ru­fen am 17. Mai 2022, von https://​arxiv​.org/​a​b​s​/​1​3​0​9​.​5​821

2 Vgl. Laney, D. (2001, 6. Febru­ar). 3D Data Manage­ment: Con­trol­ling Data Volu­me, Velo­ci­ty, and Varie­ty. Abge­ru­fen am 17. Mai 2022, von https://​idoc​.pub/​d​o​c​u​m​e​n​t​s​/​3​d​-​d​a​t​a​-​m​a​n​a​g​e​m​e​n​t​-​c​o​n​t​r​o​l​l​i​n​g​-​d​a​t​a​-​v​o​l​u​m​e​-​v​e​l​o​c​i​t​y​-​a​n​d​-​v​a​r​i​e​t​y​-​5​4​6​g​5​m​g​3​y​wn8

3 Vgl. Isi­tor, E. & Sta­nier, C. (2016). Defi­ning Big Data. In D. E. Bou­biche, H. Ham­dan & A. Boun­ceur (Hrsg.), BDAW 2016. Pro­cee­dings of the Inter­na­tio­nal Con­fe­rence on Big Data and Advan­ced Wire­less Tech­no­lo­gies. New York: ACM, 5. https://​doi​.org/​1​0​.​1​1​4​5​/​3​0​1​0​0​8​9​.​3​0​1​0​090

4 Vgl. Klein, D., Tran-Gia, P.  & Hart­mann M. (2013, 1. Juli). Big Data. Abge­ru­fen am 17. Mai 2022, von https://​gi​.de/​i​n​f​o​r​m​a​t​i​k​l​e​x​i​k​o​n​/​b​i​g​-​d​a​ta/

5 Deut­scher Ethik­rat (2017, 30. Novem­ber). Big Data und Gesund­heit – Daten­sou­ve­rä­ni­tät als infor­ma­tio­nel­le Frei­heits­ge­stal­tung [Stel­lung­nah­me], hier: S. 36, i.O. kursiv.
https://​www​.ethik​rat​.org/​f​i​l​e​a​d​m​i​n​/​P​u​b​l​i​k​a​t​i​o​n​e​n​/​S​t​e​l​l​u​n​g​n​a​h​m​e​n​/​d​e​u​t​s​c​h​/​s​t​e​l​l​u​n​g​n​a​h​m​e​-​b​i​g​-​d​a​t​a​-​u​n​d​-​g​e​s​u​n​d​h​e​i​t​.​pdf

6 May­er-Schön­ber­ger, V. (2015). Was ist Big Data? Zur Beschleu­ni­gung des mensch­li­chen Erkennt­nis­pro­zes­ses. Aus Poli­tik und Zeit­ge­schich­te, 65(11–12), 14–19, hier S. 15.

7 Ebd.

8 Mühl­hoff, R. (2020). Prä­dik­ti­ve Pri­vat­heit. War­um wir alle „etwas zu ver­ber­gen haben“. In Inter­dis­zi­pli­nä­re Arbeits­grup­pe Ver­ant­wor­tung: Maschi­nel­les Ler­nen und Künst­li­che Intel­li­genz der Ber­lin-Bran­den­bur­gi­schen Aka­de­mie der Wis­sen­schaf­ten (Hrsg.), KI als Labo­ra­to­ri­um? Ethik als Auf­ga­be (S. 37–44). Ber­lin-Bran­den­bur­gi­sche Aka­de­mie der Wis­sen­schaf­ten, hier S. 44. https://www.bbaw.de/files-bbaw/user_upload/publikationen/BBAW_Verantwortung-KI‑3–2020_PDF-A-1b.pdf

zurück
wei­ter

Übersicht:

  • Big Data Literacy
    • Über diesen Kurs
    • Fachlicher Hintergrund
      • Leben in der Datengesellschaft
      • Wechselwirkungen zwischen Mensch, Digitaltechnologie und sozialer Welt
      • Was ist “Big Data”?
      • Datenrationalität, Glaube und Diskriminierung
      • Big Data und der „Überwachungskapitalismus“
      • Was bedeutet “Big Data Literacy”?
    • Stories für die Schule
      • Warum ich etwas zu verbergen habe?
      • Wie kann ich selbst mit Daten forschen?
      • Was sagen Daten über das Lernen aus?
      • Was kann ich tun?
    • Literaturliste und weiterführende Hinweise

Fragen oder Probleme?
zfl-digitalelehre@uni-koeln.de


Impressum
Datenschutzvereinbarung

Login

Login with your site account

Lost your password?