Título do trabalho. Estimação dos Redshift de Galáxias Utilizando Dados de
Fotometria: uma Abordagem GAMLSS.
Resumo. Cosmologia é um ramo da Astronomia que busca por interpretar as origens do
Universo, bem como investigar os objetos nela presentes. Compreender como os
elementos celestes interagem e quais os fatores que influenciam para tal aspecto, são
alguns dos anseios dos pesquisadores que se debruçam nestas questões. Desde o
início do século XX, pesquisadores referem-se a expansão constante do Universo, de
maneira que galáxias e estrelas estão, em geral, se afastando da Terra a uma certa
velocidade. Astrônomos e pesquisadores desta área são capazes de identificar tal
afastamento (ou aproximação), por meio de uma medida denominada Redshift, que se
refere ao deslocamento da luz originária destes objetos celestes para o infravermelho
baseado em seu comprimento de onda. Algumas técnicas possibilitam obter uma
estimativa destes Redshift, dentre os quais se destacam o Redshift espectroscópico e o
Redshift fotométrico. Embora a primeira destas técnicas seja mais apurada no que se
refere aos valores estimados, o segundo método propõe uma diminuição de tempo e
de recursos, sendo assim, a mais considerada. Diversas alternativas na estimação de
Redshift fotométricos se mostraram extremamente eficazes e altamente utilizadas,
dentre os quais se destacam modelos estatísticos vinculadas a técnicas de Machine
Learning e Decision Tree. Buscando-se apresentar uma nova alternativa para tal
problemática, foi proposta a presente pesquisa, cujo objetivo consiste na implementa-
ção de um Modelo Aditivo Generalizado para Locação, Escala e Forma (GAMLSS)
visando a estimativa de desvios para o vermelho fotométricos de galáxias, segundo a
fotometria de diferentes comprimentos de ondas (bandas). Entende-se que devido à
natureza mais robusta e flexível dos GAMLSS, pode-se obter resultados mais
satisfatórios do que os encontrados na literatura para os Modelos Lineares
Generalizados (GLM), bem como uma alternativa viável para pesquisas
fundamentadas em redes neurais e decision tree. Para tanto, considerou-se para
a análise e interpretação dos dados o software R, de maneira que o conjunto de dados
utilizado foi proveniente do pacote CosmoPhotoz, em particular, o conjunto
denominado PHoto-z Accuracy Testing (PHAT). Devido a elevada quantidade de
observações contidas nesta base de dados (169520 dados), foi estabelecido, para
análise desta pesquisa, um total de 8476 observações (5% da base PHAT), sendo
composta 12 variáveis (Redshift fotométrico e 11 magnitudes de filtros). Por meio da
análise realizada, observou-se que as variáveis explicativas são altamente
correlacionadas, sendo necessário a utilização da técnica de componentes principais
(PCA). O modelo GAMLSS ajustado que apresentou melhores resultados contou com
suavizadores (thin plate spline s(·)) para os quatro parâmetros da distribuição Box-Cox
t original (BCTo). Em síntese, a classe de modelos GAMLSS é uma alternativa eficaz
para estimação de Redshift fotométrico, apresentando-se como uma opção
interessante para modelagem de dados desta natureza.
|