Dr. Yuen entschied sich für die IBM Cloud Pak for Data-Technologie, die auf der lokalen Private Cloud der Universität läuft. „Cloud Pak for Data erleichtert das Lernen für Studierende und Fakultätsmitglieder, die den Einstieg in die Datenanalyse suchen“, fügt Dr. Yuen hinzu. „Deshalb war es die richtige Wahl für uns.“
Zu Beginn der Zusammenarbeit führte das IBM Client Engineering Team einen Workshop durch, um die Probleme, Erwartungen und Anforderungen der Universität an akademische Anwendungsfälle zu verstehen. Das Team erfuhr auch, wie die HKSYU die Vorteile des maschinellen Lernens – und insbesondere der Verarbeitung natürlicher Sprache – nutzen wollte, um Erkenntnisse aus unstrukturierten Daten zu gewinnen, die besten Themen für die Forschung zu bestimmen und qualitativ hochwertige Analysen innerhalb eines angemessenen Zeitrahmens zu liefern.
Das Ergebnis des Workshops war ein zweiwöchiges Minimum Viable Product (MVP) der IBM Watson® Discovery Software für Nachrichtenanalysen. HKSYU hat die Datenquellen ausgewählt. Die Ergebnisse belegen die Fähigkeit der Technologie, Nachrichtendaten aufzunehmen und zu analysieren. Die Universität war beeindruckt von der umfassenden Benutzeroberfläche der Software, die den Studierenden hilft, aussagekräftige Erkenntnisse zu gewinnen, die Korrelation von Themen und Schlüsselwörtern zu überprüfen und Berichte zu erstellen.
Die Plattform bietet auch eine Reihe von Analysekomponenten, gibt der Universität aber die Flexibilität, nur die Dienste und Komponenten auszuwählen, die sie am meisten benötigt. Eine dieser Komponenten ist das grafische AutoAI-Tool der IBM Watson® Studio-Technologie, die in die IBM Cloud Pak for Data-Plattform integriert ist. Das Tool führt automatisch die wichtigsten Aufgaben zur Erstellung von Modellen für maschinelles Lernen aus, z. B. die Vorverarbeitung von Daten und die Modellauswahl. Außerdem ist keine Codierung erforderlich.
„Mit AutoAI können die Studierenden den gesamten Modellierungsprozess visualisieren, angefangen von der Datenerfassung über die Datenanalyse bis hin zu den Ergebnissen und der Leistung der Algorithmen“, sagt Dr. Yuen. „Es ist sehr einfach zu bedienen. In einer dreistündigen Vorlesung lernen die Studierenden mit Hilfe der Demo, hören sich eine Vorlesung an und üben in einer zweistündigen Laborübung. Auch den Lehrbeauftragten fällt es leichter, Datenanalyse zu unterrichten, weil es einfacher ist.“
Ein Professor nutzte IBM Cloud Pak for Data auch, um Fintech-Studierenden die Programmiersprache Python beizubringen. „Da die Studierenden die Daten leicht visualisieren können, hat sie das motiviert, Python zu lernen“, fügt Dr. Yuen hinzu. „Außerdem stehen ihnen alle erforderlichen Tools für die Datenbereinigung zur Verfügung, so dass die Aufgabe einfacher ist.“