Das Forschungsseminar richtet sich an interessierte Studierende des Master- oder Bachelorstudiums. Andere Interessenten sind jedoch jederzeit herzlich willkommen! Die vortragenden Studenten und Mitarbeiter der Professur KI stellen aktuelle forschungsorientierte Themen vor. Vorträge werden in der Regel in Englisch gehalten. Den genauen Termin einzelner Veranstaltungen entnehmen Sie bitte den Ankündigungen auf dieser Seite.

Informationen für Bachelor- und Masterstudenten

Die im Studium enthaltenen Seminarvorträge (das "Hauptseminar" im Studiengang Bachelor-IF/AIF bzw. das "Forschungsseminar" im Master) können im Rahmen dieser Veranstaltung durchgeführt werden. Beide Lehrveranstaltungen (Bachelor-Hauptseminar und Master-Forschungsseminar) haben das Ziel, dass die Teilnehmer selbstständig forschungsrelevantes Wissen erarbeiten und es anschließend im Rahmen eines Vortrages präsentieren. Von den Kandidaten wird ausreichendes Hintergrundwissen erwartet, das in der Regel durch die Teilnahme an den Vorlesungen Neurocomputing (ehem. Maschinelles Lernen) oder Neurokognition (I+II) erworben wird. Die Forschungsthemen stammen typischerweise aus den Bereichen Künstliche Intelligenz, Neurocomputing, Deep Reinforcement Learning, Neurokognition, Neurorobotische und intelligente Agenten in der virtuellen Realität. Andere Themenvorschläge sind aber ebenso herzlich willkommen!
Das Seminar wird nach individueller Absprache durchgeführt. Interessierte Studenten können unverbindlich Prof. Hamker kontaktieren, wenn sie ein Interesse haben, bei uns eine der beiden Seminarveranstaltungen abzulegen.

Kommende Veranstaltungen

Deep Learning for Recognition of Type Labels on Heating Systems in 3D Scenes

Goutham Ravinaidu

Thu, 4. 7. 2024, 14:00, https://webroom.hrz.tu-chemnitz.de/gl/jul-2tw-4nz

This presentation will cover the background and working principles used in tackling the problem statement and present the achieved results. This thesis aims to detect the type labels present on the heating systems from a video sequence and extract the text present on those labels. The various object detection models used to localize the labels, the use of image quality analysis to ensure quality, and the utilization of various OCR models used in extracting the text information. This presentation also shows the results of the completed pipeline of the thesis with the combined use of object detectors, quality control and OCR models. I will finally discuss the results and provide a conclusion.

Vergangene Veranstaltungen

Optimizing Neural Network Architectures for Fail-Degraded Computing Scenarios in Automated Driving Applications

Diksha Vijesh Maheshwari

Fri, 28. 6. 2024, 1/368 and https://webroom.hrz.tu-chemnitz.de/gl/jul-2tw-4nz

Neural networks (NNs) are commonly used in automated driving applications. With shrinking transistor size for denser integration, integrated circuits become increasingly susceptible to permanent faults. These permanent faults can lead to a complete loss of functionality, which is unacceptable in safety-critical applications. The thesis introduces a robust Fail Degradation-Aware Quantization (FDQ) strategy coupled with sensitivity prediction algorithms to maintain high algorithmic performance in presence of permanent faults. The FDQ method improves the optimization process by incorporating losses for both higher and lower precision to compute optimal quantization step sizes for model parameters and activations. Additionally, the thesis investigates various sensitivity prediction algorithms that identify the critical components of the model, enabling strategic computational remapping of sensitive features to insensitive features to enhance model robustness and accuracy. Experimental results with ResNet18 and VGG16 models on CIFAR-10 and GTSRB dataset showcase the effectiveness of integrating FDQ with sensitivity-driven task remapping in hardware accelerators, significantly improve the robustness of NNs against permanent faults, ensuring sustained functionality and accuracy under adverse conditions. Specifically, at the highest fault injection error rate of 6.20% for the ResNet18 model on CIFAR-10 dataset, the FDQ method along with sensitivity remapping improved the accuracy by 10% from 76.60% to 87.07%.

Observational Learning: Neue Konzepte und exemplarische Realisierung eines Agenten innerhalb einer virtuellen Umgebung

Leon Kolberg

Mon, 17. 6. 2024, 1/367a and https://webroom.hrz.tu-chemnitz.de/gl/jul-2tw-4nz

Während uns Menschen 'Lernen durch Beobachtung' intuitiv gelingt, ist das programmieren und trainieren von künstlicher Intelligenz teuer und zeitaufwendig. In dieser Arbeit stelle ich Verfahren zum Lernen durch Beobachtung für Künstliche Intelligenzen vor und präsentiere eine eigene exemplarische Implementation mit einem Neuronalen Netz und Q-Learning in einer virtuellen Realität. Die Ergebnisse dieser Arbeit zeigen nicht nur die Machbarkeit von Observational Learning in einer virtuellen Umgebung, sondern sie zeigen auch Vorteile, Nachteile sowie Risiken, die abgewogen werden müssen.

Funktionsweise des Softwareframeworkes Lava im Vergleich zu ANNarchy

Andreas Schadli

Thu, 13. 6. 2024, 1/368 and https://webroom.hrz.tu-chemnitz.de/gl/jul-2tw-4nz

Diese Bachelorarbeit befasst sich mit dem Softwareframework LAVA, das für neuromorphe Hardware, insbesondere den Loihi-Chip von Intel, entwickelt wurde. Um LAVA mit dem Neurosimulator ANNarchy zu vergleichen, wurden verschiedene Experimente durchgeführt. Dabei wurden Beispielsimulationen in beiden Softwares implementiert und anhand folgender Fragen verglichen: Ist es möglich, die Simulationen in beide Softwares zu übertragen? Sind die Simulationsergebnisse identisch oder gibt es Unterschiede? Wie unterscheiden sich die Arten und Weisen, in denen die Simulationen implementiert wurden? Welche Laufzeitunterschiede bestehen? Die Experimente beleuchten die unterschiedlichen Implementierungsstile, und die Ergebnisse zeigen, dass beide Softwares ähnliche Resultate liefern können und dass LAVA deutlich längere Ausführungszeiten als ANNarchy benötigt.

Investigation of Reward-Guided Plasticity in Recurrent Neural Networks for Working Memory Tasks

Max Werler

Thu, 16. 5. 2024, 1/368 and https://webroom.hrz.tu-chemnitz.de/gl/jul-2tw-4nz

A variety of recent works have indicated that Perturbation Learning provides a valid approach to train the recurrent weights of an artificial recurrent neural network. In this context, Miconi (2017) demonstrated how the thereby induced deflections of the excitation of the neurons can be captured based on information that is locally available to synapses in a Hebbian manner and how these can be integrated into a reward-guided weight update rule such that it characterizes a biologically plausible training algorithm that is capable to solve cognitive tasks. However, his learning architecture suffers from a significant flaw that effectively can prohibit learning progress for some random initial conditions and disrupt a successfully converged network towards an error level like it was observed before training. In this thesis, we investigate these scenarios intending to find the underlying network properties that cause this undesired behavior. As low intrinsic activity and imbalance between excitation and inhibition were detected to strongly correlate with these phenomena, related learning rules as well as a different input weight initialization scheme have been proposed and evaluated. While our results show that we were able to enhance the speed as well as reliability of the initial network convergence greatly, the possibility for a sudden deterioration of a temporarily successful network remains existent.

Comparison of two motor learning models of the basal ganglia and cerebellum

Christoph Ruff

Thu, 2. 5. 2024, 1/368 and https://webroom.hrz.tu-chemnitz.de/gl/jul-2tw-4nz

A model of motor learning, which was developed here on the professorship by Baladron et al [1] will be compared with a motor learning model from Todorov et al [2]. Both models use a model of the basal ganglia (BG) and the cerebellum (CB). The BG chooses a certain action and reaches to that location, while the CB fine-tunes the reached location to come closer to the target or adapt the movement to an altered location. Both models have a different structure and therefore function differently. During the seminar I will give a closer overlook on how these two models differ and what are advantages/disadvantages of them. The tasks with which these two models were trained differ as well. As part of my internship, I trained the model from Baladron et al [1] with the tasks of Todorov et al [2] to see which parameter values and adaptations are necessary to get a similar result and if it even is possible to train the model with these tasks. The results of this implementation will be presented as well.

Neuromorphic Computing as a Low Power, Minimal Footprint Solution for Dynamical System Control

Valentin Forch

Thu, 18. 4. 2024, 1/368 and https://webroom.hrz.tu-chemnitz.de/gl/jul-2tw-4nz

In cooperation with the Research Center for Materials, Architectures and Integration of Nanomembranes (MAIN) we develop a neural network architecture that will enable the control of autonomous modular micro robots carrying CMOS chiplets. Realizing a neural network controller on this scale poses multiple challenges: the machine must run on a minimal energy budget, minimal memory footprint, and can only be build on top of a low-level instruction set. Further, these machines should in principle be able to adapt to changing environments without a complete re-training.
To answer these challenges, we start by optimizing recurrent spiking neural networks for simple motor control benchmarks in an evolutionary framework. The networks possess a simplified integrate-and-fire neuron model and ultra low resolution synapses. We further reduce the memory footprint by optimizing only subsets of the network connectivity matrix and by controlling multiple network weights through singular bits. By controlling the neural network and resulting motor activity, we find well-performing solutions that minimize energy consumption. Lastly, we introduce a novel approach for optimizing agents through highly parallelized swarm evolution.

ANNarchy User Forum

Helge Ülo Dinkelbach, Julien Vitay

Thu, 11. 4. 2024, 1/368 and https://webroom.hrz.tu-chemnitz.de/gl/jul-2tw-4nz

Topics will be:

  1. ANNarchy 4.7.3
    • Introduction to the features and extensions since 4.7.0
  2. Spotlight features and discussion
    • Float-precision handling in ANNarchy
    • Auto-tuning in ANNarchy, the new default?
  3. Future developments
  4. Resources overview
  5. Open forum
    • Removal of the MagicNetwork
    • Discussing the future network interface and handling
    • Discussing your feature requests and ideas

Auswirkungen tiefer Hirnstimulation auf gewohnheitsmäßiges Lernen der Basalganglien

Dave Apenburg

Tue, 12. 3. 2024, 367 and https://webroom.hrz.tu-chemnitz.de/gl/jul-2tw-4nz

Tiefe Hirnstimulation (DBS) ist eine wirksame Behandlungsmethode, um Bewegungsstörungen bei Dystonie-Patienten zu lindern. In einer Studie von De A Marcelino et al. (2023) wurde dazu untersucht, wie Dystonie-Patienten mit ein- oder ausgeschalteter DBS-Elektrode im Globus Pallidus pars interna (GPi) der Basalganglien (BG) eine Belohnungsumkehraufgabe lösen. In dieser Arbeit wird diese Studie mit dem Basalganglienmodell von Villagrasa et al. (2018) nachgebildet. Da die Auswirkungen von DBS weitgehend unerforscht sind, wurden vier bestehende Theorien (1) Hemmung lokaler Neurone, (2) Stimulation efferenter Axone, (3) Stimulation afferenter Axone und (4) Stimulation vorbeilaufender Fasern eingebunden und untersucht. Aus einer bisherigen Studie (Baladron & Hamker, 2020) geht außerdem hervor, dass eine plastische Verbindung (Shortcut) vom Cortex zum Thalamus gewohnheitsmäßiges Lernen in den Basalganglien unterstützt. Durch einen Wechsel zwischen einem festen und einem plastischen Shortcut konnte diese Aussage validiert werden. Außerdem wurde nach dem Umkehrlernen ein Unterschied in der Anzahl gewohnter Entscheidungen zwischen den DBS-Varianten und eine höhere Anzahl gewohnter Entscheidungen mit eingeschaltetem DBS als ohne DBS festgestellt. Diese Arbeit soll somit zu einem besseren Verständnis des Einflusses von DBS auf die BG-Schaltkreise und gewohnheitsmäßigem Lernen in den Basalganglien beitragen.

Optimierung der Neuromodellparameter eines Spiking Netzwerkes mit Neuroevolution

Tom Maier

Thu, 22. 2. 2024, 367 and https://webroom.hrz.tu-chemnitz.de/gl/jul-2tw-4nz

In dieser Bachelorarbeit geht es um die Verbesserung der Leistung von konvertierten Spiking Neural Networks (SNNs) um deren besonderen Eigenschaften ausnutzen zu können und gleichzeitiges eine hohe Genauigkeit zu erzielen. Dafür werden bestimmte Parameter der SNNs nach der Konvertierung und Normalisierung durch die Methode von Diehl et al. aus einem Multi-Layer Perceptrons mithilfe der Covariance Matrix Adaption-Evolutionsstrategie (CMA-ES) in einem Evolutionsprozess optimiert. Der Erfolg der Evolution wurde dabei über die Genauigkeit der Klassifizierung auf dem Fashion-MNIST Datensatz gemessen, welcher auch für die Werte des Ausgangsnetzwerks und des rein konvertierten SNN verwendet wurde. Um verschiedene Effekte der Daten auf die Evolution und die Leistung des SNN zu prüfen, wurden verschiedene Konfigurationen der Größe des Datensatzes und der beinhalteten Elemente in einzelnen Durchläufen verwendet. Die Evolution der Parameter ermöglichte eine Verbesserung in den Klassifizierungen auf ein vergleichbares Niveau wie das des ursprünglichen MLP-Modells. Also erfolgte eine starke Verbesserung der Leistung gegenüber des ausschließlich konvertiert und normalisierten SNN.

Time Series Forecasting of Cashflow Data using Deep Learning

Preksha Gampa

Mon, 22. 1. 2024, https://webroom.hrz.tu-chemnitz.de/gl/jul-2tw-4nz

Time series forecasting is a pivotal technique in the analysis of business operations and resource availability. It is widely used across several industries to predict future events, thereby assisting in crucial and data-driven decision-making processes. At Mercedes-Benz Mobility AG, an application called `myCashflow' is used to provide the daily forecasts of cash positioning for various Mercedes-Benz entities all around the Africa and Asia Pacific (AAP) region. This application currently relies on machine learning and traditional statistical models for the analysis and forecasting of the cashflow data. These models enable the application to capture the inherent patterns present in the time series data and generate high-precision forecasts. However, with the advancement of deep learning techniques, there is a potential for enhancing the forecasting capability of the myCashflow application, thereby assisting in better decision-making. This research focuses on exploring deep learning methodologies for forecasting cashflow data while addressing the challenges of high data fluctuations, short-length time series, and potential outliers. Three advanced deep learning methodologies are explored, namely Convolutional Neural Networks (CNN), Ensemble Empirical Mode Decomposition combined with CNN (EEMD-CNN), and Transfer learning with CNN. A comprehensive evaluation and comparison of the employed deep learning methodologies with established machine learning and statistical models are undertaken to identify the most effective and efficient approach for enhancing the predictive accuracy of cashflow forecasts.

Erklärbarkeit von Modellen maschinellen Lernens und Anwendung auf die 2. Fußballbundesliga

Simon Schulze

Thu, 18. 1. 2024, 1/309 and https://webroom.hrz.tu-chemnitz.de/gl/jul-2tw-4nz

Methoden der eXplainable Artificial Intelligence (XAI) sind unabdingbar, um komplexe und undurchsichtige Algorithmen der künstlichen Intelligenz (KI) beziehungsweise des maschinellen Lernens (ML) erklärbar und verständlich zu machen. Zudem werden KI- und ML-Algorithmen immer häufiger im Bereich der Datenanalyse im Fußball verwendet. Diese Seminararbeit untersucht den Einsatz zweier XAI-Verfahren am Beispiel der 2. Fußballbundesliga, um für den Spielausgang ausschlaggebende Statistiken zu identifizieren. Partial Dependence Plots (PDPs) und Shapley Werte sollen erläutert und auf Modellen, welche auf Datensätzen der 2.Fußballbundesliga trainiert wurden, angewandt werden. Die Vorhersagen der Modelle sollen dadurch einen höheren Grad an Erklärbarkeit und Nachvollziehbarkeit erhalten. Mit Hilfe von PDPs kann der Zusammenhang bestimmter Statistiken und des erwarteten Spielausgangs analysiert werden, während Shapley Werte einen Einblick in den individuellen Beitrag von Merkmalen zum Endergebnis ermöglichen. Die gewonnen Erkenntnisse sollen einen tieferen Einblick in die Schlüsselfaktoren, die den Ausgang einer Partie maßgeblich beeinflussen, geben. Diese Forschung trägt zur wachsenden Disziplin der XAI, unter anderem im Bereich der Datenanalyse im Fußball, bei und verdeutlich das Potential, komplexe sportliche Ereignisse systematisch zu entschlüsseln.

Open-ended optimization of recurrent neuromorphic architecture through neuroevolution

Martina Kraußer

Tue, 16. 1. 2024, 1/367 and https://webroom.hrz.tu-chemnitz.de/gl/jul-2tw-4nz

While deep neural networks achieve human-level performance in some tasks, their energy consumption if implemented on von Neumann architectures is orders of magnitude above the brain. This motivates research in neuromorphic hardware which has significant less energy consumption by operating neural networks. Frenkel et al. (2018) presented ODIN neuromorphic chip, a digital spiking neuromorphic processor with minimal size and energy consumption. However, its simplified computing architecture does not allow a straight-forward application of gradient-based deep learning techniques. Neuroevolution, a subfield of AI, is employed to train neural networks through evolutionary algorithms, avoiding gradient-based modification of individual weights. This can even reach better and faster results for tasks with high uncertainty about their destination, like playing games or movement control. The Paired Open-Ended Trailblazer (POET) algorithm, introduced by Wang et al. (2019), is surpassing traditional neuroevolutionary approaches that only focus on the adaption from agents in a fixed environment by simulating dynamically changing environments over the time. POET strategically starts with simpler tasks, building skills hierarchically and expediting problem-solving abilities. POET algorithm is used to assess the learning capabilities of the ODIN neuromorphic chip in mastering the game of Pong. The objective is to explore whether the ODIN chip exhibits a general enhancement across various game parameters, contributing to a broader understanding of its adaptability and performance in its adaptability and performance in diverse pong gaming scenarios and therefore in the task of systematically controlling movements.

