read_more
Campus Virtual Fiocruz

Introdução à Análise de Dados para pesquisa no SUS

Módulo 3 | Aula 3
Dados com estruturas de dependência: multiníveis, séries temporais e espaciais e sobrevida

Tópico 1

Introdução

Modelos lineares e não lineares simples são populares devido à sua facilidade de uso e interpretação. No entanto, quando lidamos com dados que possuem estruturas de dependência complexas, como dados multiníveis, séries temporais, dados espaciais e análise de sobrevivência, esses modelos podem não capturar adequadamente as nuances e interdependências presentes. Então, quando precisamos desses outros modelos?

Bom, quando os observamos nas variáveis que usamos para responder à determinada pergunta de pesquisa dependências mais complexas.

Exemplo

Em dados multiníveis, há estruturas hierárquicas ou agrupamentos naturais nos dados.
Exemplo: pacientes de um mesmo médico ou de certos hospitais têm essa comunalidade, que certamente vai influenciar no tratamento recebido.

Em séries temporais, os dados apresentam uma dependência no tempo.
Exemplo: a ocorrência de infectados por dengue hoje certamente depende do número de infectados por dengue ontem.

Em dados espaciais, observamos correlações entre observações próximas fisicamente/geograficamente.
Exemplo: no caso de doenças altamente transmissíveis como ebola, a proximidade dos indivíduos lhes confere uma dependência espacial para aquisição ou não da doença.

Na análise de sobrevivência, o foco é na modelagem do tempo até determinado desfecho.
Exemplo: tempo até o falecimento de pessoas com câncer após o início de determinado tratamento.

Dessa forma, ao lidar com dados que possuem estruturas de dependência mais complexas, a escolha de modelos mais avançados é essencial para garantir uma análise robusta e coerente. Esses modelos não apenas capturam melhor as interações e dependências nos dados, como também proporcionam previsões mais precisas, melhor compreensão dos fenômenos em estudo e base sólida para a tomada de decisões.

Vamos agora entender melhor os principais modelos estatísticos utilizados para analisar cada um desses problemas.