Big Data Analytics

In der Lehrveranstaltung werden Grundlagen und Techniken zur Auswertung großer Datenmengen mittels Neuronaler Netze vermittelt. Diese Daten lassen sich neben ihrer Größe durch vier weitere Merkmale charakterisieren: hohe Variabilität, stetiger und massiver Zuwachs und hohe Komplexität. Die zur Analyse notwendigen Techniken und Methoden, bekommen die Studierenden in diesem Modul vermittelt. Die Learning Outcomes sind wie folgt:

(WAS): Die Studierenden werden fachlich in die Lage versetzt die Charakteristika, Potenziale und Risiken von Big Data zu verstehen und abzuschätzen und eine systematische Planung und Umsetzung der Analyse von Massendaten unter spezifischen wirtschaftlichen wie wissenschaftlichen Fragestellungen vorzunehmen,
(WOMIT):indem sie Daten mit Python vorverarbeiten, säubern und transformieren können, darüber hinaus Analysemethoden wie Neuronale Netze und Deep Learning verstehen, anwenden und optimieren und reale, große Datensätzen analysieren, Ergebnisse visualisieren und interpretieren sowie berichten können,
(WOZU): um mit den aus umfangreichen Analysen und Ergebnismodellen gewonnenen Erkenntnissen Handlungsempfehlungen und Entscheidungen abzuleiten und für die Wissenschaft und Wirtschaft aufzubereiten.
Grundlagen
  • Einfache Neuronale Netze
  • Tensoren und Tensoroperationen
  • Stochastic Gradient Descent
  • Back propagation
  • Feed forward Netze
  • Deep Learning Ansätze
Ansätze
  • Convolutional und Recurrent Neural Networks (CNN & RNN)
  • Training, Testing und Validierung (Kreuzvalidierung)
  • Deployment
  • Over-/Underfitting: L2-Regularisierung und Dropout
Praxis
  • Jupyter Notebooks (Python) Grundlagen für Umsetzung mit Tensorflow und Keras in Google Colab
  • Anwendungsbeispiele aus den Bereichen
  • Computer Vision
  • Textanalyse und Word Embeddings
  • Sequenzanalyse