Faça uma busca
Faça uma busca

LSST na UFRJ: Estudante do Observatório do Valongo desenvolve catálogo de redshifts fotométricos em larga escala com dados simulados do LSST

14 de novembro de 2025

Andreia Dourado, estudante de astronomia do Observatório do Valongo (OV-UFRJ) e ex-bolsista do LIneA, defendeu seu trabalho de conclusão de curso intitulado “Geração de um catálogo de redshifts fotométricos em larga escala, utilizando os dados da simulação DP0.2 do LSST”, sob orientação de Bruno Moraes (UFRJ e membro do BPG) e Julia Gschwend (cientista de dados do LIneA e program manager BRA-LIN), em 19 de setembro. 

Os photo-zs foram estimados com o algoritmo de machine learning TPZ (Trees for Photo-Z), baseado na construção de florestas aleatórias de árvores de decisão. Como parte do processo de geração do catálogo, foi construído um training set representativo a partir dos dados simulados do LSST DP0.2, aplicando seleções de qualidade. O estudo analisou o impacto dos principais hiperparâmetros do TPZ e das diferentes escolhas de atributos de treinamento sobre o resultado final, com base em métricas de viés, dispersão, fração de outliers e calibração das distribuições de probabilidade (PDFs) geradas.

O LIneA teve papel fundamental no desenvolvimento do trabalho. Toda a estrutura computacional e as ferramentas utilizadas, desde a seleção dos dados até a geração do catálogo final, foram desenvolvidas pela equipe do laboratório. Para aplicar o modelo treinado em um conjunto de dados de alta volumetria, foi utilizado o pipeline PZ Compute, desenvolvido pelo LIneA como parte de sua contribuição in-kind para o LSST, executado no cluster de computadores Apollo.

Andreia diz: “Durante o desenvolvimento do projeto, tive uma interação direta com a equipe do LIneA, acompanhando o avanço das contribuições do laboratório para o LSST e utilizando os resultados do TCC como validação científica das ferramentas em preparação para a chegada dos dados reais.”

Outro aspecto importante do trabalho foi a documentação detalhada dos processos e resultados, essencial em um contexto de colaboração científica que exige reprodutibilidade e confiabilidade. Para isso, além do uso do Github, os resultados gerados no trabalho foram armazenados na plataforma PZ Server, que permite registrar, documentar e compartilhar todas as etapas de geração do catálogo e seus produtos de dados com a comunidade científica através da colaboração.

Recentemente, Andreia foi aprovada no processo seletivo do programa de pós-graduação em Física do Instituto de Física da UFRJ, onde já está cursando o primeiro semestre do mestrado sob orientação da professora Arianna Cortesi. Parabenizamos a Andreia pela defesa do trabalho e desejamos sucesso em sua carreira!

O LIneA é um instituto de ciência e tecnologia privado cuja missão é viabilizar a participação de pesquisadores e estudantes em colaborações internacionais, apoiar centros emergentes, fornecer acesso a acervos de dados astronômicos e a uma infraestrutura de processamento intensivo de dados, e desenvolver soluções para problemas de big data nas áreas de astronomia e cosmologia. Atualmente as atividades do LIneA são apoiadas pela FINEP e pelo INCT do e-Universo.