Daten – das Gold unserer Zeit

Schon mal was von der DSGVO gehört? Genau. Jeder kennt sie, kaum jemand weiß so recht, was sie nützt. Und was hat es eigentlich mit den nervigen Cookie-Bannern auf sich, die wohl eher schlecht als recht Einzug gewonnen haben in unseren täglichen Wellenritt im Netz der scheinbar unbegrenzten Weite, auch wenn es bis dato noch auf unsere Welt beschränkt ist, die nicht mehr so weit erscheint wie vor etwa 30 Jahren?

Blog Daten

Mit all unseren noch so kurzen und scheinbar unerheblichen Aktivitäten und Bewegungen im World Wide Web hinterlassen wir Spuren – sprichwörtliche Krümel (Cookies) –, die für viele Unternehmen ebenso sprichwörtliches Gold wert sind. Der Wert liegt fest verankert in den Daten. Präzise Daten und damit wertvolle Informationen über unser Konsum- oder Nutzerverhalten, unsere Interessen, unsere sozialen Gegebenheiten, die den Unternehmen helfen, Profit zu generieren – und wenn es auch einer Manipulation bedarf. So scheint es einleuchtend, dass dieses wertvolle Gut geschützt werden sollte.

„So what?“

Was man mit so einer Masse an Informationen anstellen kann, haben die jüngsten Ergebnisse aus dem Bereich des maschinellen Lernens gezeigt. Large Language Models (LLM) sind beeindruckende Hinweise darauf, wie viel Wert und Nutzen wir aus den sich jährlich verzehnfachenden Daten ziehen können, wenn wir sie nur richtig einzusetzen wissen. Es bleibt spannend zu sehen, was uns diese Entwicklung in naher Zukunft noch an disruptiven Veränderungen bringen wird. Ganz nebenbei spiegeln diese schon menschlich anmutenden Systeme die Konflikte und Makel in unserer Gesellschaft wider. Allen voran jegliche Form von Diskriminierung. Wir sind alle nur Menschen. Und gelernt haben diese sprechenden Datenbündel von – eben uns. 
Interessant ist übrigens, dass der Singular von „Daten“ nur etymologisch existiert (Datum), praktisch aber nicht, da er so gut wie nie Verwendung findet.

Input vs. Instinkt – was tun mit den Daten?

Worin besteht also die Herausforderung? Solch eine Informationsflut gilt es, erst einmal zu ordnen und zu strukturieren und im Idealfall sogar noch zu kennzeichnen. Ähnlich, wie dass das Kinderzimmer aufgeräumt werden muss, damit wir schnell finden, wonach wir suchen.

A propos Kinder: Auch in der Linguistik herrscht Uneinigkeit darüber, ob der sprachliche Input (Daten) oder die sogenannte Universalgrammatik (Lernalgorithmen), die eine instinktive sprachliche Veranlagung des Menschen beschreibt, für das Wunder des schnellen Spracherwerbs im Kleinkindalter verantwortlich ist.

Wir als Gesamtgesellschaft machen im Moment Ähnliches durch. Die unfassbar große Menge an Informationen gilt es, zu verstehen und sinnvoll zu verwerten, denn jedes Unternehmen – bewusst oder unbewusst – sammelt Unmengen an Daten an. Sie waren schon immer da, nur das Bewusstsein dafür ist heute stärker. Neben dem Schutz von Daten Dritter, seien es Kunden oder Dienstleister, sollten wir uns auch Gedanken darüber machen, wie wir diese Informationen zum Vorteil aller Beteiligten aus- und verwerten. 

Ein schönes Beispiel sind unsere geliebten Translation Memories und Terminologiedatenbanken – Schätze an Wissen und Information sowie Speicher für die Kunstwerke der Übersetzer und Lektoren. Diese gekonnt einzusetzen und mit Hilfe von Metadaten noch weiter zu spezifizieren, ist eine spannende und respekteinflößende Aufgabe zugleich, die wir Tag für Tag mit einem analytischen Händchen und einer Prise Pragmatismus angehen. 
Besonders deutlich wurde die Wichtigkeit der Qualität der Daten beim maschinellen Lernen. Ein Sprachmodell ist nur so gut wie sein Input. Dazu gehört auch das geschickte Annotieren der Daten – die Kirsche obendrauf.

Packen wir’s an! Ist ja offenbar kinderleicht. 

Mohamed Boudan
«Mohamed ist seit 2021 bei Apostroph als Language Technology Expert beschäftigt. Als studierter Linguist bringt er dank seiner Leidenschaft und Versiertheit in den Themen Sprache und neu entstehende sowie innovative Technologien wertvolle Insights in die Gruppe. Als Familienmensch legt er großen Wert auf ein soziales Mit- und Füreinander – deshalb ist er der Überzeugung, dass Technik immer dem Menschen helfen und nicht nur zum Selbstzweck existieren sollte.»
Mohamed Boudan · Language Technology Expert, Apostroph Germany

Haben Sie Fragen oder sind Sie an einer Zusammenarbeit interessiert?

Gerne beantworte ich Ihre Fragen oder stelle Ihnen Apostroph Germany und unsere Leistungen in einem persönlichen Gespräch vor.
Tamara Weßel
Operative Geschäftsleitung
Tamara Weßel Operative Geschäftsleitung Apostroph Germany

Gemeinsam Ziele erreichen

  • Sprachintelligenz

    Unsere Language Technology Experts sorgen für den cleveren Einsatz von Technologien, sodass Mensch und Maschine auf intelligente Weise harmonieren.
  • Wir sprechen Ihre Sprache

    Je nach Projekt stellen wir gezielt Teams aus internen und externen Expertinnen und Experten zusammen, die Ihre Corporate Language umsetzen.
  • Partnerschaftliche Zusammenarbeit

    Mit vielen Kundinnen und Kunden verbindet uns eine langjährige Partnerschaft. Neben der Qualität schätzen sie unsere Werte wie Zuverlässigkeit, Transparenz und Fairness.