Met de opkomst van moderne instrumentatie worden de datasets die we onderzoeken enorm groot en extreem complex: Zo is het soms nodig om miljarden sterren tegelijk te analyseren, of om zorgvuldig de minuscule manieren waarop het binnenkomende licht verstoord kan worden te beheersen. Tegelijkertijd zijn astrofysische simulaties enorm gegroeid in formaat en complexiteit, wat nieuwe aanpakken nodig maakt om ze computationeel uitvoerbaar te houden en om door de grote hoeveelheden informatie die ze produceren te pluizen. Het combineren van deze complexe simulaties met moderne, heterogene datasets is één van de huidige grote uitdagingen in de astronomie.
Statistiek en machinelearning bij API
Om deze uitdagingen het hoofd te bieden richt moderne astronomie zich op de snelle vooruitgang in statistiek en informatica. Bij API gebruiken we een breed scala aan state-of-the-art statistische aanpakken, inclusief bayesiaanse (hierarchische) modellering, simulatie-geïnformeerde inferentie, spectraal-timing, probabilistisch programmeren en meer om te profiteren van de gevarieerde datasets die we tot onze beschikking hebben. Tegelijkertijd is machinelearning een cruciale rol gaan innemen in astronomische dataverwerking, data mining en -analyse. We implementeren bijvoorbeeld machinelearning in onze pipelines om interessante uitbarstingen in radiodata te vinden, om complexe astrofysische modellen voor sterren, protoplanetaire schijven en zwarte gaten te emuleren en te versnellen, en om grote datasets voor nieuwe astrofysische fenomenen te minen.
Trefwoorden
Astrostatistiek, machinelearning, artificiele intelligentie, time series analyse, spectraaltiming, bayesiaanse inferentie