Entwicklung einer Methodik zur strukturierten Literaturrecherche in der Datenwissenschaft (data science), durch Kombination von Verfahren zur systematischen Erhebung und Analyse von Forschungsarbeiten für Survey-Paper.

Beginn: Ab sofort

Erstbetreuer: Prof. Dr. Heisenberg

Zweitbetreuer: Rusalka Offer, MSc.

Niveau: Bachelorarbeit

Problemstellung: In der Wissenschaft sind Publikationen probate Mittel, um die Zielgruppe (wissenschaftliche Comunity) über neue Ansätze, Methoden und Ergebnisse zu informieren. Darüber hinaus legen diese oft den Grundstein für Kooperationen und die Beantragung von Fördermitteln. Innerhalb der Menge der Publikationen (kurz auch 'paper' genannt) stellen Survey-Paper eine Sonderklasse dar. Ein solches Überblickspapier ist ein wissenschaftlicher Artikel eines oder mehrerer Autoren, der aktuelle Forschungsergebnisse einer Wissensdomäne auf neuartige Art und Weise zusammenfasst und organisiert und damit einen komprimierten Überblick der relevantesten Forschungsarbeiten innerhalb der Domäne zur Verfügung stellt. Das Survey-Paper setzt ein allgemeines Wissen über das Gebiet voraus. Dabei betont dieser wissenschaftliche Artikel die Klassifizierung der vorhandenen Literatur, die Entwicklung einer Perspektive auf das Gebiet und die Bewertung von Trends. Kernstück eines jeden Survey-Papers sind somit die Recherchemethoden und der Auswertungssystematik mit der die aktuellen Forschungsergebnisse (in Form von Publikationen) einer Wissensdomäne erhoben und analysiert werden. Zu den Research-Methoden gehören Recherchestrategien wie das sogenannte Berry Picking, Perlenstrategie und die Blockstrategie. Ziel dieser Abschlussarbeit ist es eine Methodik zu entwickeln, mit welcher daraus entstehende Survey-Paper systematisch die relevantesten Veröffentlichungen einer Wissensdomäne erschliessen und kategorisieren.
Bei der Entwicklung einer Methodik sollten folgende Aspekte einfliessen:
  • die Entwicklung von Suchvokabular mittels geeigneter Descriptoren
  • die Entwicklung eines Recherche-Sheets mit Ober- und Unterbegriffen
  • die systematische Boolsche Verknüpfung der Suchterme
  • die Entwicklung von Auswahlkriterien beim Screening der Artikel
  • die Einbeziehung bewährter Techniken wie:
    • Footnote chasing(backwardchaining)
    • Citationsearching(forwardchaining)
    • Journal run
    • Area scanning
    • Subject searching
    • Author searching
  • die Einbeziehung moderner Tools und Portale wie:
    • https://www.connectedpapers.com/
    • https://www.scopus.com/search/
    • Large Language Models wie z.B. ChatGPT
    • weitere
  • die Einbeziehung von Webquellen für Artikel und Datensätze wie:
    • Medium
    • Kaggle
    • KDNuggets
    • github
    • zenodo

ChatGPT