Ir para o conteúdo

Detalhes

Prezados:

Comunico que nosso próximo Meetup será realizado no dia 04/07/2018.

Local: Anfiteatro B – Programa de Pós-Graduação em Engenharia de Produção (PPGEP) -CTC-UFSC

Horário: 18h 30min

Programação

Modelagem de Dados Complexos por Meio de Extensões do Modelo de Regressão Clássico
Ministrante: Luiz Ricardo Nakamura

Resumo: Em todos os campos da ciência e tecnologia, a quantidade de dados vem crescendo rapidamente e analisá-los de maneira adequada tornou-se mais desafiador do que nunca. Comumente, os conjuntos de dados apresentam uma variável resposta univariada que pode ser explicada por uma ou mais variáveis explicativas. Em geral, esse tipo de problema é estudado por meio de modelos de regressão linear e não-linear clássicos e/ou modelos lineares generalizados (GLM) quando a normalidade da variável resposta não é constatada. Em alguns casos um pouco mais complexos, em que não só a variação residual deve ser considerada como uma variável aleatória, utilizam-se ainda os modelos lineares generalizados mistos (GLMM). Uma outra abordagem bastante utilizada são os modelos aditivos generalizados (GAM) e os modelos aditivos generalizados mistos (GAMM) que são um pouco mais flexı́veis que o GLM e o GLMM pois consideram funções não-paramétricas em seus modelos. Dois grandes problemas dos modelos supracitados são: i) a variável resposta, necessariamente, deve ser modelada por uma distribuição pertencente à famı́lia exponencial (no caso dos modelos de regressão linear e não-linear clássicos, a resposta sempre segue uma distribuição normal) e ii) apenas os parâmetros referentes à média e à variância (o segundo de maneira indireta) são modelados, ou seja, em casos em que são observados não somente problemas com a heterogeneidade dos dados como, por exemplo, dados extremamente assimétricos e/ou com curtose muito baixa ou alta, os GLM, GLMM, GAM e GAMM talvez não sejam as melhores opções disponı́veis. Nesse contexto, os modelos aditivos generalizados para locação, escala e forma (GAMLSS) são uma interessante alternativa, uma vez que extinguem a pressuposição de que a variável resposta segue uma distribuição pertencente à famı́lia exponencial e é capaz de modelar todo e qualquer parâmetro da referida distribuição por meio de funções paramétricas e não-paramétricas (como, por exemplo os splines penalizados). Neste seminário será apresentada uma introdução à classe de modelo GAMLSS e como ele pode ser facilmente utilizado com base em pacotes e funções disponı́veis no software R, a partir de uma contextualização histórica dos modelos citados.

Contamos com a sua participação!

Tópicos relacionados

Você também pode gostar