Das Dortmund Data Science Center (DoDSc) ist ein interdisziplinäres Zentrum der TU Dortmund, an dem die datenwissenschaftliche Forschung innerhalb der TU Dortmund und in ihrem Umfeld gebündelt wird. Es wird getragen durch die Gründungsfakultäten Statistik, Informatik, Mathematik und Physik sowie durch die Fakultät für Chemie und Chemische Biologie (CCB) und das Institut für Journalistik. Dieser Kreis ist offen für weitere Beteiligungen und Kooperationen.
Das Zentrum beinhaltet Aspekte der Forschung, der Lehre, der Infrastruktur und des Transfers.
Interessierte können sich unter der Kontakt Emailadresse (s. rechts) auf unseren E-Mailverteiler aufnehmen lassen. Hochschullehrer sowie die Leiter von Forschungsprojekten an der TU Dortmund können auf diesem Wege formlos die Mitgliedschaft im DoDSc beantragen.
Das Data Literacy Projekt Data Competence Network widmet sich der
Ausbildung in Datenkompetenzen für alle Studierenden der TU Dortmund.
Zur Data Literacy-Lehre geht es hier.
Das sechste Kolloquium des Dortmund Data Science Centers findet statt
am Donnerstag, 25. März 2021, 16:15 bis 17:45 Uhr,
online via Zoom.
Weitere Informationen und Termine folgen in Kürze: DoDSc Kolloquium
DaCoNet-Projektleiterin Katja Ickstadt spricht im "Spotlight-Forschung"-Interview über Data Literacy.
„Datenkompetenz heißt: Sprache lernen einmal anders“
Das Interview finden Sie hier.
Das weiterbildende Studium "Data Science & Big Data" wird von der Fakultät Statistik der TU Dortmund in Kooperation mit dem Bereich Weiterbildung angeboten.
Moderne Kenntnisse zum Management und zur Analyse großer Daten erwerben und praktisch anwenden - das bietet Ihnen das weiterbildende Studium "Data Science & Big Data". Nach bestandener Abschlussprüfung erhalten Sie ein aussagekräftiges Universitätszertifikat. Infos: Flyer als PDF.
Anmeldeschluss ist der 4. Dezember, Start ist der 5. Februar 2021.
Ausführliche Informationen und Kontakte für Rückfragen finden Sie unter: www.zhb.tu-dortmund.de/datascience
Im Interview spricht Henrike Weinert über das Data Literacy Projekt der TU-Dortmund, "DaCoNet". Enthalten sind Informationen was in den zugehörigen Lehrveranstaltungen vermittelt wird und Details zur Anmeldung.
Das ganze Interview gibt es hier.
Semi-Structured Deep Distributional Regression
Date:Thursday, October 29, 2020, 4:15-5:45pm,
Online: via web-conference
Presence (limited to 15P, pre-registration required):
Lecture Room E23, Otto-Hahn-Str. 14, Campus Nord, TU Dortmund
Abstract: Semi-Structured Deep Distributional Regression (SDDR) is a unified network architecture for deep distributional regression in which entire distributions can be learned in a general framework of interpretable regression models and deep neural networks. The approach combines advanced statistical models and deep neural networks within a unifying network, contrasting previous approaches that embed the neural network part as a predictor in an additive regression model. To avoid identifiability issues between different model parts, an orthogonalization cell projects the deep neural network part into the orthogonal complement of the statistical model predictor, facilitating both estimation and interpretability in high-dimensional settings. The framework is implemented in an R software package based on TensorFlow and provides a formula user interface to specify the models based on the linear predictors.
Short bio: Dr. David Rügamer is a lecturer and postdoctoral research fellow at the chair of Statistical Learning and Data Science (Prof. Bischl), Department of Statistics, LMU Munich, where he also leads two research subgroups on machine learning and deep learning. Before joining the chair, he has worked as Senior Data Science in the industry with focus on data engineering and deep learning research. From 2014 to 2018 he did his PhD under the supervision of Prof. Dr. Sonja Greven and was partly funded by the Emmy Noether project ‘Statistical Methods for Longitudinal Functional Data’.
Link: https://www.slds.stat.uni-muenchen.de/people/ruegamer/
Studierende der Fakultät Statistik und der Fakultät für Informatik der TU Dortmund haben beim jährlich stattfindenden DATA MINING CUP, einem internationalen Wettbewerb für intelligente Datenanalyse und Prognose, gemeinsam den ersten Platz belegt. Damit konnten sie sich gegen 161 Teams von 126 Universitäten aus 35 Ländern durchsetzen. Das Team aus Dortmund, das sich aus 16 Bachelor- und Masterstudierenden zusammensetzte, erhielt ein Preisgeld in Höhe von 2.000 Euro.
Weitere Informationen: Offizielle Pressemitteilung
Bedingt durch die Corona-Krise und die damit verbundenen Einschränkungen findet an den Universitäten der UA Ruhr gerade ein außergewöhnliches Sommersemester statt und auch MERCUR wurde beim Start seiner neuen Förderprogramme vor Herausforderungen gestellt. Denn geplant waren eigentlich zahlreiche Veranstaltungen an den Universitäten, auf denen über die neuen Fördermöglichkeiten informiert und Fragen zur Antragstellung beantworten werden sollten.
Aufgrund der Kontaktbeschränkungen stellen wir einen Informationsflyer (s.u.) zur Verfügung, um Sie auf die neuen Förderprogramme von MERCUR aufmerksam zu machen. Dieser enthält eine kurze Übersicht über die aktuellen Förderlinien. Weiterführende Informationen finden Sie auf der neuen Internetseite www.mercur-research.de. Bei Fragen kontaktieren Sie gerne die Geschäftsstelle von MERCUR. Diese ist besetzt und per E-Mail oder Telefon erreichbar. Beratungsgespräche zur Beantragung neuer Projekte und dazu, wie Sie die Fördermittel von MERCUR bestmöglich für Ihre Forschung nutzen können, werden auch via Videokonferenz durchgeführt oder – unter Einhaltung der Abstandsregeln – bei einem Spaziergang über den Campus.
Die Dortmunder Wissenschaftler Erich Schubert, Professor für Data Mining, und Claus Weihs, pensionierter Professor für Computergestützte Statistik, veröffentlichen ihre unterschiedlichen Modellierungen der täglichen und kumulativen COVID-19 Fallzahlen. Ihre datengetriebenen Modelle berücksichtigen dabei zeitlich wiederkehrende Trends, wie den Wochenverlauf, oder die erwartete Saturierung und Stagnation der Infektionszahlen. Die verwendeten Daten stammen u.a. aus den frei verfügbaren Quellen des Robert-Koch-Instituts.
Prof. Dr. Erich Schubert, Prognose der COVID-19 Neuinfektionen
Prof. Dr. Claus Weihs, Vorhersage des Infektionsverlaufs von COVID-19
Towards a Principled Bayesian Workflow
Der Termin wurde aufgrund der Coronaviren-Pandemie abgesagt.
Date: Thursday, May 14, 2019, 4:15-5:45pm,
Lecture Room E23, Otto-Hahn-Str. 14, Campus Nord, TU Dortmund
Abstract:
Probabilistic programming languages such as Stan, which can be used to specify and fit Bayesian models, have revolutionized the practical application of Bayesian statistics. They are an integral part of Bayesian data analysis and provide the basis for obtaining reliable and valid inference. However, they are not sufficient by themselves. Instead, they have to be combined with substantive statistical and subject matter knowledge, expertise in programming and data analysis, as well as critical thinking about the decisions made in the process. A principled Bayesian workflow for data analysis consists of several steps from the design of the study, gathering of the data, model building, estimation, and validation, to the final conclusions about the effects under study. I want to present a concept for an interactive Bayesian workflow which helps users by diagnosing problems and giving recommendations for sensible next steps. This concept gives rise to a lot of interesting research questions we want to investigate in the upcoming years.
Short bio:
Dr. Paul Bürkner is a statistician currently working as a postdoc at Aalto University (Finland), Department of Computer Science. Previously, he has studied Psychology and Mathematics at the Universities of Münster and Hagen and did his PhD about optimal design and Bayesian data analysis at the University of Münster. As a member of the Stan development team and author of the R package brms, a lot of Paul’s work is dedicated to the development and application of Bayesian methods. Specifically, he works on a Bayesian workflow for data analysis that guides researchers and practitioners from the design of their studies to the final decision-making process using state-of-the-art Bayesian statistical methods.
Machine Learning (ML) ist eine treibende Kraft für viele erfolgreiche Anwendungen in der Künstlichen Intelligenz. ML-Pipelines gewährleisten Garantien für die Gesamtheit des Systems (d.h. horizontale Zertifizierung) sowie für jede einzelne Komponente (d.h. vertikale Zertifizierung). Der ETMLP-Workshop wird diese Möglichkeiten und die damit verbundenen Herausforderungen untersuchen. Das Hauptziel dieses Workshops ist es, ein Forum zu schaffen, in dem sich Forscher aus den Bereichen Machine Learning, Datenmanagement und Praxis mit Ideen zur Erklärbarkeit und zertifizierten Vertrauenswürdigkeit von ML-Pipelines auf Pipeline- und Komponentenebene befassen. An der Organisation sind mehrere Mitglieder des DoDSc sowie des SFB 876 und des ML2R beteiligt. Wir freuen uns über inhaltliche Beiträge seitens der TU Dortmund. Deadline für die Einreichung ist der 20 Dezember 2019.
Weitere Informationen: https://europe.naverlabs.com/etmlp/
Title: Causality in Data Science
Speaker: Jonas Peters (Department of Mathematical Sciences, University of Copenhagen, Denmark)
Monday, March 16, 2020, 4.15 pm
Otto-Hahn-Str. 14, E023 (Department of Computer Science), TU Dortmund
Wann: Montag 02.03.2020, 9:00 - 16:00 Uhr
Wo: Raum G2 ZE15, Emil-Figge-Str. 70, TU Dortmund
Was: Zwei externe Vorträge, early-work/in-progress work von Doktoranden, Diskussionen und Feedback.
Weitere Informationen: Impressionen vom Workshop, Einladung und Programm
Mit rund drei Millionen Euro fördert das Ministerium für Kultur und Wissenschaft des Landes Nordrhein-Westfalen in Kooperation mit dem Stifterverband das Programm "Data Literacy Education.nrw". Der Begriff Data Literacy umfasst digitale Fähigkeiten, statistische Kompetenzen und den Umgang mit der digitalen Analyse großer Datenmengen sowie die kritische Beurteilung der Ergebnisse. Zehn Hochschulen in Nordrhein-Westfalen erhalten für die Umsetzung ihrer besonderen Ideen für die Vermittlung von Datenkompetenzen an Studierende jeweils ein Fördergeld in Höhe von bis zu 300.000 Euro. Darunter wurde auch die TU Dortmund von der Jury zur Förderung ausgewählt. Das DoDSc ist hierbei als zentrale Schnittstelle beteiligt.
Pressemitteilung der TU Dortmund: https://www.tu-dortmund.de/studium/meldungen/meldung/tu-dortmund-gewinnt-im-wettbewerb-data-literacy-educationnrw/
Pressemitteilung des Stifterverbandes: https://www.stifterverband.org/pressemitteilungen/2019_11_18_data_literacy_education_nrw
Das erste Kolloquium des Dortmund Data Science Centers findet statt
am Donnerstag, 11. Juli 2019, 16:15 bis 17:45 Uhr,
im Hörsaal E23, Otto-Hahn-Str. 14, Campus Nord, TU Dortmund.
Es sind elf Kurzvorträge von je 5min Länge geplant. Diese werden aktuelle Forschungsarbeiten, Projekte und Problemstellungen verschiedener Bereiche vorstellen.
Weitere Informationen: DoDSc Kolloquium
Anja Karliczek, Bundesministerin für Bildung und Forschung, besuchte am 9. Juli 2019 gemeinsam mit Journalistinnen und Journalisten das Kompetenzzentrum Maschinelles Lernen Rhein-Ruhr (ML2R). Die Ministerin nutzte die Gelegenheit, praktische Anwendungen der Künstlichen Intelligenz (KI) und des Maschinellen Lernens (ML) live zu erleben und selbst auszuprobieren: Sie begegnete Robotern, die KI und ML spielerisch begreifbar machen, entdeckte KI-Systeme, die gesprochene Sprache analysieren, Satellitenbilder verbessern und autonomes Fahren sicherer machen, über ihr summte ein Drohnenschwarm. Damit verschaffte sich die Ministerin Eindrücke von herausragenden Projekten, die im Rahmen des ML2R durch das Bundesministerium für Bildung und Forschung (BMBF) gefördert werden. Auch das DoDSc war bei dieser Gelegenheit vertreten. Bildnachweis: TU Dortmund/Oliver Schaper.
Hier geht es zum vollständigen Pressebericht.