Benchmarking verschiedener Kolmogorov-Arnold-Netzwerk-Architekturen auf Standarddatensätzen

Beginn: Ab sofort

Erstbetreuer: Prof. Dr. Heisenberg

Zweitbetreuer: Dr. Akdag

Niveau: Masterarbeit

Problemstellung:
Kolmogorov-Arnold-Netzwerke (KANs) stellen eine neue Klasse funktionaler neuronaler Netze dar, die durch explizite 1D-Funktionsapproximationen intrinsische Interpretierbarkeit mit hoher Modellflexibilität kombinieren. Während erste Arbeiten (z. B. ursprüngliche KAN, Spline-KAN) vielversprechende Ergebnisse zeigen, fehlt bislang ein reproduzierbarer, systematischer Vergleich moderner Varianten wie Fourier-KAN, Rational-KAN, Sparse-KAN oder Regularized KAN. Insbesondere ist unklar, welche Architektur unter welchen Dateneigenschaften (Tabulardaten, Zeitreihen, verrauschte Daten) die besten Trade-offs zwischen Genauigkeit, Stabilität und Interpretierbarkeit liefert.
Ziel der Arbeit:
Ziel der Arbeit ist die Durchführung eines State-of-the-art Benchmarks verschiedener KAN-Architekturen auf etablierten Datensätzen. Dabei sollen neben klassischen Gütemaßen auch Trainingsdynamik, Skalierbarkeit sowie strukturelle Eigenschaften der gelernten Funktionen untersucht werden. Ein besonderer Fokus liegt auf Zeitreihendaten (z. B. CAMELS-DE), ergänzt durch etablierte ML-Benchmarks (z. B. UCI, OpenML).
Vorgehensweise:
  • Implementierung und Vergleich mehrerer KAN-Varianten (z. B. Spline-KAN, Fourier-KAN, Rational-KAN, Sparse-KAN, Regularized KAN)
  • Definition eines reproduzierbaren Benchmark-Protokolls (Train/Validation/Test Splits, Cross-Validation, Seed-Kontrolle)
  • Auswahl standardisierter Datensätze (z. B. CAMELS-DE, UCI, OpenML, Zeitreihen-Benchmarks)
  • Evaluation anhand etablierter Metriken (z. B. RMSE, MAE, NSE, R²)
  • Analyse der Trainingsstabilität (Konvergenzverhalten, Sensitivität gegenüber Initialisierung)
  • Untersuchung der Generalisierungsfähigkeit (Out-of-sample Performance)
  • Analyse der Interpretierbarkeit (Glattheit, Monotonie, physikalische Plausibilität der gelernten Funktionen)
  • Optional: Vergleich mit Baselines (MLP, XGBoost, LSTM)
Voraussetzungen:
Sehr gute Kenntnisse in Python und Machine Learning (PyTorch oder JAX) sind erforderlich. Erfahrung mit experimentellem Design, Benchmarking und Zeitreihenanalyse ist von Vorteil. Interesse an interpretierbaren ML-Modellen wird vorausgesetzt.

KAN Netzwerk