Interview
«Wir werden überflutet mit Informationen»
Die Daten werden immer mehr – halten unsere Kenntnisse da noch Schritt? Beim Stichwort «Data Literacy» geht es im Grunde um die simple Frage: Brauchen wir alle dringend neue digitale Kompetenzen oder können wir das getrost den Experten überlassen?
Es war ein wenig kompliziert, die Runde zusammenzubringen. Volle Terminkalender einerseits und eine gewisse Zurückhaltung andererseits, was das Thema anging: Data Literacy – was ist denn das genau? Und was hat das mit den Fachgebieten der angefragten Freiburger Expertinnen und Experten zu tun, mit Public Health, mit Machine Learning, mit digitalen Lern-Tools? Eine ganze Menge, wie sich im Gepräch zeigt. Denn Daten sind überall und deren Interpretation hat ihre Tücken. Als man sich im NeighborHub auf dem alten Cardinal-Areal an einen Tisch gesetzt und über die jeweiligen fachlichen Hintergründe ausgetauscht hat, entspinnt sich rasch ein lebhaftes Gespräch. Die verschiedenen Perspektiven laufen im selben Punkt zusammen: Es gibt da ein gehöriges Problem, was unseren kundigen und mündigen Umgang mit Daten angeht – eine einfache Lösung des Problems dagegen, die gibt es nicht.
Sie alle sind mehr als Data Literates, Sie sind Digital- und Datenprofis. Fühlen sie sich trotzdem manchmal auch «illiterate», also ungebildet, im digitalen Bereich?
Cristian Carmeli: Ich arbeite ja ständig mit Daten und glaube schon, da souverän zu sein. Auch wenn ich weiss, dass man bei der Interpretation vorsichtig sein muss.
Elena Mugellini: Ich würde auch sagen, dass ich eine gute Kenntnis der Systeme habe mit denen wir arbeiten.
Philippe Cudré-Mauroux: Ich schliesse mich an, auch ich glaube meine digitalen Tools gut zu beherrschen.
Ok, falscher Start – ich hätte vielleicht keine Daten-Profis einladen sollen zu diesem Gespräch. Aber es muss doch Momente geben, in denen Sie sich auch nicht ganz auf der Höhe fühlen, im weiten Bereich des Digitalen.
Cristian Carmeli: Ok, ich mag es nicht, allzu viel Zeit mit meinem Smartphone zu verschwenden. Die ganzen Social-Media-Kanäle, das ist nicht meine Welt.
Elena Mugellini: Ja, dafür habe ich auch keine Zeit, da kenne ich mich entsprechend nicht so gut aus.
Philippe Cudré-Mauroux: Neben der womöglichen Unmündigkeit im Umgang mit Social Media sehe ich schon auch eine grundsätzlichere Schwierigkeit. Ich weiss ganz genau, wie beschränkt meine Mittel sind – egal wie gut ich meine Tools beherrsche –, wenn ich Daten analysieren soll, die ich nicht selber gesammelt habe. Da kann es rasch passieren, dass diese Daten so gut wie gar keinen Wert mehr haben, weil ich ihren Kontext nicht kenne.
Wie meinen Sie das? Ihnen zerfallen die Daten gewissermassen in den Fingern, sobald Sie sie analysieren möchten?
Philippe Cudré-Mauroux: Wenn mir die Metadaten fehlen kann das passieren, ja. Und diese Kontextinformationen werden häufig nicht erfasst. Das ist gewissermassen die Ironie an der Daten-Geschichte: Wenn etwas nicht in digitaler Form vorliegt, dann ist es ein wenig so, als wäre es als Information gar nicht vorhanden, es wird einfach weggelassen, auch wenn es sehr wichtig sein kann für die Analyse.
Cristian Carmeli: Wobei es ja einen grossen Effort gibt inzwischen, auch viele Metadaten zu erfassen und zu berücksichtigen.
Also stimmt die simple Formel nicht, die man im Machine-Learning-Kontext sonst häufig hört: Je mehr Daten desto besser, desto leichter lernt die Maschine, desto mehr können wir erkennen?
Philippe Cudré-Mauroux: Nicht so simpel, nein. In näherer Zukunft sind uns da auf Datenseite noch einige Grenzen gesetzt – ein grosser Teil der Arbeit mit Daten ist und bleibt manuell.
Cristian Carmeli: Der Kontext ist bei uns im medizinischen Kontext natürlich auch ein grosses Thema. Man sollte sich immer bewusst machen, wie die Daten erhoben worden sind, aus welcher Art Studie sie stammen, diese Informationen sind sehr wesentlich bei der Interpretation. Konnten sich nur Freiwillige einschreiben zum Beispiel? Dann kann man sicher sein, dass die gewonnenen Daten schon einen Bias beinhalten.
Bias, Metadaten, Machine Learning: womöglich hat man die Begriffe auch schon gehört, aber was sie mit der Alltagsrealität von uns allen zu tun haben, ist nicht so leicht fassbar zu machen. Davon profitieren die grossen Digitalfirmen wie Google, Facebook oder Apple, die allesamt eigentlich Datensammler- und Verwerter sind. Ihnen ist die Unmündigkeit der Nutzerinnen und Nutzer ganz recht, die Bequemlichkeit, auf immer mehr wie geschmiert laufende Onlineservices und Apps zugreifen zu können und nicht so recht zu wissen – oder sogar: wissen zu wollen – was da im Hintergrund alles abläuft. Dabei generieren wir alle tagtäglich eine Unmenge an Daten, die viel über uns verraten. Und gerade hier sind Metadaten von entscheidender Bedeutung: Mit wem ich wie lange telefoniere sagt womöglich mehr aus als der konkrete Inhalt der Gespräche. Andererseits werden aus Daten immer mehr auch für die Gesellschaft wichtige Informationen gewonnen, da spielt dann die Künstliche Intelligenz (aka Machine Learning) eine wichtige Rolle. Politische Entscheide, Wirtschaftsprozesse, meine persönliche Kreditwürdigkeit, das heisst also zum Beispiel ob ich eine Wohnung bekomme oder nicht: All das beruht zusehends auf Daten, nicht auf Erfahrungswerten oder gar auf Intuition.
Bias: Das heisst eine Verzerrung der Datengrundlage, die sich dann auch in den Resultaten zeigt – für den Begriff gibt es nicht wirklich eine gute deutsche Übersetzung. Ein wichtiges und auch sehr sensibles Thema, das die Daten-Community durchaus stark beschäftigt, von dem die breite Bevölkerung aber kaum etwas weiss. Daten sind nicht einfach «neutral». Müsste man das ändern, sollte man zur Problematik des Daten-Bias bereits in der Schule etwas hören?
Elena Mugellini: Das wäre auf jeden Fall ein Bildungsauftrag, ja – und nicht einfach, den Schülern beizubringen wie man ein Word-Dokument erstellt. Aber das ist doch genau die Crux: Was meinen wir denn genau mit Data Literacy? Meinen wir damit digitale Skills oder meinen wir mehr ein theoretisches Wissen zur Datenanalyse? Es ist klar: Ein Minimum an Kompetenzen braucht es, jeder Bürger hat jeden Tag mit Digitalisierung und Daten zu tun. Aber ich habe das Gefühl, dass uns die grundlegende Idee fehlt, was Sinn machen würde. Einfach Coding-Kurse für alle anzubieten: das wäre bestimmt keine Lösung.
Cristian Carmeli: Ich fände es aber auf jeden Fall gut, Kurse zu Daten-Themen schon am Gymnasium anzubieten. Wie werden medizinische Erkenntnisse gewonnen, wie muss man mit Daten umgehen, wie sind diese einzuordnen.
Im Zusammenhang mit Medizin und Public Health wären das dann im Grunde genommen Kurse in Statistik, oder? Ich kann mir die Begeisterung der Gymnasiasten – und der Lehrerinnen und Lehrer lebhaft vorstellen.
Elena Mugellini: Man muss ja nicht nur das unterrichten, was den Schülern Spass macht. Sondern das, was wichtig ist.
Philippe Cudré-Mauroux: Wir machen das ja schon seit längerem, in enger Zusammenarbeit mit der Berner Hasler Stiftung – wir versuchen, «Informatik-Denken» in die Klassenzimmer zu bringen.
Was beinhaltet das denn?
Philippe Cudré-Mauroux: Fragen wie: Was ist ein Algorithmus? Oder auch Fragen der Medienkompetenz, des Umgangs mit digitalen Plattformen. Damit kann man schon früh anfangen, in der Primar- oder Sekundarschule, und eine solche «Informatik-Frühförderung» kann ganz anderes bedeuten, als Kindern das Programmieren beizubringen.
Also nicht einfach: die Jungen fit für Informatikjobs machen?
Philippe Cudré-Mauroux: Nein, es geht da um sehr viel grundlegendere Kenntnisse. Wir machen das ja nicht einfach, weil es ein Manko an Software-Ingenieuren gibt. Sondern weil man heute andere Kenntnisse braucht, um sich zurechtzufinden und um mündig entscheiden zu können. Und nicht zuletzt auch, um einen kritischen Blick zu entwickeln: Was passiert genau mit meinen Daten, wer nutzt diese wozu?
Vielleicht sollten wir mal über die «Datenlage» da draussen sprechen, über die Entwicklung im Feld des Digitalen. Die Veränderungen sind ja tatsächlich markant.
Elena Mugellini: Ich glaube allerdings, dass die grosse Herausforderung unserer Zeit in der raschen Veränderung liegt, auf der technischen Ebene. Wie sollen wir da überhaupt noch auf dem Laufenden bleiben?
Philippe Cudré-Mauroux: Auch wird der Zugang zu Daten immer leichter, wir werden ja überflutet mit Informationen.
Cristian Carmeli: Da bin ich einverstanden. Allerdings wird es nicht einfach sein, dieser Situation in der Schule auf richtige Art zu begegnen. Ich mache selber auch Beratung, für ausgebildete Ärzte, eine Art Grundkurs in Datenanalyse. Und da sehe ich, dass mitunter die einfachsten Grundlagen fehlen, da treffe ich tatsächlich eine «Illiteracy» an. Wie soll man diese Grundlagen einer breiten Bevölkerung näherbringen, wenn schon Fachleute Mühe bekunden, souverän mit komplexen Daten umzugehen?
Wie haben Sie das im Zusammenhang mit Covid erlebt, dieser fast schon obsessive Umgang mit Gesundheitsdaten in den vergangenen Monaten, die Fixation auf Zahlen und die Kontroversen?
Cristian Carmeli: Ich würde schon sagen, dass es da im Laufe der Zeit eine Verbesserung in der Kommunikation medizinischer Erkenntnisse gab. Und vielleicht haben wir auch langsam ein Verständnis dafür gewonnen, dass wir die Impfskeptiker nicht einfach mit mehr Faktenevidenz überzeugen können.
Elena Mugellini: Apropos Covid: Ich bin sicher, das wird in der Schule auch sonst viel auslösen, in dem Sinne, dass es auch noch andere Arten gibt, wie man lernen kann, neben dem klassischen – und analog geprägten – Präsenzunterricht.
Sie haben ja Erfahrung damit, Apps für Jugendliche zu entwickeln, um ihnen vielleicht eher unpopuläre Inhalte nahezubringen, zum Beispiel gesünderes Leben. Könnten Sie sich auch vorstellen, ein App zu bauen, das jungen Leuten Daten-Kompetenz vermittelt?
Elena Mugellini: Warum nicht? Mathematik und Statistik sind sehr abstrakte Konzepte, das müsste man versuchen, greifbarer zu machen. Ich bin überzeugt, dass es da interessante Möglichkeiten gäbe.
Sehen Sie sich da als Forschende auch in der Verantwortung, der Gesellschaft gegenüber? Oder sollte man sich im Gegenteil darauf konzentrieren, dass immerhin die Profis mit ihrer Datenkompetenz up to date bleiben?
Philippe Cudré-Mauroux: Auf jeden Fall ist es so, dass unsere Welt immer komplexer wird, wir sind mittendrin in dieser Entwicklung. Und wäre es nicht genau die Rolle der Universität, da zu helfen und der Gesellschaft die Möglichkeit zu geben, mit dieser Komplexität umzugehen? Das Modell, eine Ausbildung zu machen und dann das ganze Leben denselben Job zu machen, funktioniert jedenfalls nicht mehr. Life long learning würde dann auch heissen, immer wieder neu mit dieser Komplexität umgehen zu lernen.
Elena Mugellini: Das glaube ich auch, aber die Komplexität bedeutet eben auch: Es wird da keine einfache Lösung geben, die all das abdeckt, was wir hier diskutieren.
Philippe Cudré-Mauroux: Natürlich. Aber nehmen wir mal ein konkretes Beispiel aus der Informatik, um zu illustrieren, wie wichtig es heute ist, grundlegende Konzepte zu verstehen. Hat man ein ungefähres Wissen über Machine Learning, dann wird man zum Beispiel in einem selbstfahrenden Auto nicht so naiv sein, einfach das Lenkrad loszulassen und der Maschine vollkommen zu vertrauen.
Cristian Carmeli: Tatsächlich habe ich das Gefühl, dass wir da ein eigenartiges Phänomen beobachten. Da tut sich eine Schere auf: Entweder begegnet man der Komplexität mit einem «Übervertrauen» oder aber mit einem kompletten Misstrauen.
Was dann wieder an unsere Überforderung im Zusammenhang mit Covid und der komplexen medizinischen Datenlage erinnert.
Elena Mugellini: Ich weiss nicht, ich bin da nur so halb überzeugt. Wir alle nutzen doch tagtäglich komplexe Maschinen, ohne dass wir unbedingt verstehen müssen, wie sie funktionieren, zum Beispiel beim Autofahren. Da gibt es ein gesundes Vertrauen in Technik, ich sehe nicht unbedingt, was daran verkehrt wäre.
Hier könnte man nun einwenden, dass es keine allzu grosse Rolle spielt, wenn man den Antrieb seines Autos nicht versteht. Und dass sich für den Ingenieur, der einen Automotor optimiert, auch nicht zwingend komplexe ethische Fragen stellen. Digitale Systeme aber dringen viel tiefer in unseren Alltag ein und bestimmen diesen zuweilen auch mit. Wie gehen wir zum Beispiel mit der Möglichkeit um, unsere Handys als medizinische Frühwarnsysteme einzusetzen? Aus subtilen Veränderungen der Art, wie wir den Touchscreen bedienen, lassen sich wahrscheinlich sensible Informationen zu depressiven Schüben oder zu anderen psychischen Problemen herauslesen. Derzeit laufen diverse Studien, die das Potential solch niederschwelliger Medizin-Scans untersuchen, eine der grössten wird von Apple koordiniert. Ob wir das eher nützlich oder eher unheimlich finden können wir wohl nur als Gesellschaft entscheiden. Es geht da also auch um eine Mündigkeit in dem Sinne, dass wir die Kontrolle darüber behalten, wie Daten erhoben und wie sie ausgewertet werden, und auch: wie sie missbraucht werden könnten.
Also ein Plädoyer für mehr Vertrauen, auch in die Nutzerinnen und Nutzer?
Philippe Cudré-Mauroux: Ich finde den Vergleich mit dem Auto gar nicht so schlecht, man muss ja auch beweisen, dass man das Fahrzeug beherrscht, bevor man mit ihm fahren darf. Vielleicht bräuchte es etwas ähnliches für den Umgang mit den digitalen Maschinerien, mit denen wir es heute oft zu tun haben. Einen Führerschein in Data Literacy.
Spannender Gedanke. Was uns wieder zur Frage führt, was genau da geprüft werden müsste, um so einen Führerschein zu bekommen.
Philippe Cudré-Mauroux: Ja, es gibt da verschiedene wichtige Ebenen: Statistische Grundkenntnisse wären auf jeden Fall wünschenswert, das haben wir gerade jetzt gesehen, im Covid-Kontext. Aber auch ein Wissen über Machine Learning: was können solche Systeme, was nicht. Ebenso wichtig finde ich einen souveränen Umgang mit Social Media.
Schliessen wir also mit einem Wunschkonzert: Was müsste im Unterrichtsfach «Data Literacy» unterrichtet werden?
Elena Mugellini: Ich würde das sehr wörtlich nehmen, «literacy»: Also tatsächlich Daten lesen und schreiben können. Genau deshalb gehen wir ja in die Schule: um diese Fähigkeiten zu erlangen, damit wir handlungsfähig sind in der Gesellschaft.
Cristian Carmeli: Ich würde da schon gern noch die Epidemiologie mit hineinbringen als Kompetenz, also das Verständnis von Gesundheitsdaten. Wenn nur schon das Grundkonzept verstanden würde, dass es immer die Individuen gibt und die Population und dass man das nicht so leicht durcheinanderbringen darf, auf der Datenebene. Das wäre schon ein grosser Gewinn.
Elena Mugellini ist Professorin an der Fachhochschule Westschweiz in Fribourg (HES-SO). Die Informatikerin ist Leiterin des HumanTech Institute. Das Institut zielt darauf ab, die Lebensqualität durch den Einsatz neuer Technologien zu verbessern und ihre Fähigkeiten als Individuen sowie als Mitglieder einer zunehmend dynamischen, nomadischen und globalisierten Gesellschaft zu stärken. Mugellinis Forschungsschwerpunkte liegen in den Bereichen Mensch-Computer-Interaktion und intelligente Datenanalyse.
elena.mugellini@unifr.ch
Philippe Cudré-Mauroux ist ordentlicher Professor für Informatik an der Universität Freiburg, wo er das eXascale Infolab leitet. Er arbeitete unter anderem am Database Systems Lab am MIT, an der EPFL und bei IBM (Watson Research). Seine Dissertation über Emergent Semantics wurde 2007 mit dem EPFL-Doktorandenpreis und der EPFL-Press Mention ausgezeichnet. Seine Forschungsinteressen sind Exascale Information Management, Big Data und Linked Data.
philippe.cudre-mauroux@unifr.ch
Cristian Carmeli arbeitet am Population Health Laboratory der Universität Freiburg, wo er sein Fachwissen in Biostatistik, Epidemiologie und maschinellem Lernen einbringt. Ebenso ist er Senior Lecturer im Bereich Health Data Science. Er hat an der EPFL in angewandten dynamischen Systemen promoviert und verfügt über Erfahrungen in Forschungsbereichen von klinischen Neurowissenschaften bis zur Bioinformatik. Mit einem interdisziplinären Ansatz macht er Big Data im Public Health-Bereich nutzbar. Seine pädagogische Mission sieht er im Werben für solide Analysemethoden in der Medizin.
cristian.carmeli@unifr.ch