Durch die Mengen an Informationen und Neuigkeiten, die im Internet tagtäglich veröffentlicht werden, ist es schwer einzuschätzen, was der Wahrheit entspricht und was sich als sogenannte „Fake News“ entpuppt. Dazu kommt, dass es vielen Leuten an Zeit fehlt, die nötige Recherche zu betreiben, um dies herauszufinden. Mit diesem Hintergrund wird häufig Clickbaiting betrieben, um somit die Zugriffzahlen auf Artikel mit entsprechend unkorrekten Inhalten zu erhöhen.  

News Classification ist ein Tool, das mit Hilfe von Machine Learning determiniert, ob der Inhalt eines Artikels wahrheitsgemäß ist oder Unwahrheiten enthält. Hierfür werden dem Model verschiedene Nachrichtenartikel eingespeist, welche abhängig von ihrer Quelle entsprechend gelabelt werden. Die Daten werden verarbeitet und dann tokenisiert, damit sie für Machine Learning verwendet werden können. Eine AI analysiert die Artikel anschließend anhand von Text und Stilometrie. In anderen Worten: Jeder hat ein bestimmtes Schreibverhalten, das sich je nach geschriebenem Inhalt verändert. Dieses Muster bestimmt das Tool durch eine Analyse und schätzt somit ein, ob es sich um korrekte Informationen handelt. Darauf erhält der Artikel eine Bewertung, die angibt wie vertrauenswürdig er ist.  

News Classification using Machine Learning ist ein Use Case, das sich aus der Masterarbeit von Abdelhakim entwickelte. „In der heutigen Zeit ist unsere Aufmerksamkeitsspanne sehr begrenzt. Wir werden im Sekundentakt mit schnelllebigen Informationen bombardiert, was dazu geführt hat, dass wir ungeduldiger sind. Das macht es leichter, uns mit gefälschten Artikeln zu täuschen, die klickstarke Titel tragen“, gibt Abdelhakim als seine Motivation für das Tool zu erkennen. „Das Ziel dieses Projekts ist es, diesen bösartigen Trend zu bekämpfen, indem es dem Benutzer die Möglichkeit gibt, den Wahrheitsgehalt eines Artikels mit einem Knopfdruck zu überprüfen.“

 

Tech Stack 

Technologien: Azure, Kafka, Python 

Bei der Entwicklung des Tools wurde Azure genutzt, um die AI durch das Durchsuchen von Nachrichtenartikel darauf zu trainieren, bestimmte Muster und Facetten zu erkennen. Python wurde als Programmsprache für das Machine Learning genutzt.