(S2/E07) Gehören Sie auch zu den langweiligen, für Geheimdienste und fremde Staaten uninteressanten Menschen? Und auch Ihre Nutzung von Social Media oder Streaming Diensten kann und darf jeder und jede sehen? Und doch bleibt ein leichtes Grummeln – da könnte ja was dran sein, an den Warnungen vor Big Data Datenanalysen, die manchmal mehr über Sie wissen als gute Freunde oder gar Ihr Mann oder Ihre Frau?
In dieser Folge beschäftigen wir uns ausschliesslich mit einer einzigen Studie, die zudem eine gewisse Bekanntheit erlangt hat: Das „Spiegel Mining“ von David Kriesel.
Über drei Jahre hat er seine Crawler, flinke unermüdliche Software-Datensammler, nach Stundenplan Informationen von der Spiegel-Online Website “saugen” lassen. Alles legal und legitim, nicht belästigend.
Was er rausfindet gehört in die Kategorie: Hätten Sie’s gewusst? Oder besser noch: „Du ahnst es nicht” Wir klären auf, was man so braucht, um ein Mining durchzuführen.
Und übrigens: Das Thema Datamining kann auch zum Informationssammeln genutzt werden für Firmenrepräsentanzen im Web. Manchmal gibt man mehr preis, als man will. Auch für Firmen eine lohnenswerte Folge.
Das Episodenbild
Das Bild zur Folge wurde von einer künstlichen Intelligenz namens DALL-E erzeugt. Es trägt passenderweise den Titel „Du ahnst es nicht!“. Es wurde von der KI aus der Phrase/ dem Prompt: „impressionist style painting „3 persons in the garden say_ you do not guess!“„,
Phrase, Prompt und Auswahl von Hans-Werner Klein. 12/2022
Mehr zu DALL-E in der achwas.fm Podcast-Folge „Was weißt Du über Clickbait…?“ S2/E06.
Quellen
- Die zu Grunde liegende Studie von David Kriesel ist über verschiedene Kanäle zugänglich:
Youtube (Abfrage 4.12.2022, 18:15)
https://www.youtube.com/watch?v=gsnL4m57MCM
Website von David Kriesel (auf der Website sind auch die PDF des Vortrags und mehr Infos (Abfrage 4.12.2022, 18:00):
https://www.dkriesel.com/blog/2016/1229_video_und_folien_meines_33c3-vortrags_spiegelmining - Der Link zur Bilder generierenden KI DALL_E 2: https://openai.com/dall-e-2/
- CRiSP DM – Ein Standard zur Datenanalyse und Datamining, Den imho besten Artikel hält diese „Towards Datascience“ Website bereit (Abfrage am 4.11.2022 18:40).
https://towardsdatascience.com/crisp-dm-methodology-for-your-first-data-science-project-769f35e0346c - Immer wieder einen Blick wert, die Website mit den Schein-Korrelationen (abgefragt 4.11.2022, 18:45) von Tyler Vigen.
http://www.tylervigen.com/spurious-correlations