Uncategorized

Momento Folclórico do Dia (intervalo)

10. O Caboclo Namorado (Sergipe)

Um caboclo dizia sempre a uma senhora que via à janela: Bom dia, meu cravo! Sabendo, o marido fê-la responder: – Bom dia, meu amor! e convidá-lo para voltar durante a noite. Fingindo-se surpreendida pelo marido a mulher esconde o caboclo debaixo da cama que está cheia de urtigas. Inchado de coçar-se, ferido pelos espinhos, o caboclo geme e remexe-se. O marido pergunta: – Quem está aí debaixo da cama? – O caboclo responde: É o cachorro! – E cachorro fala? – Muito aperreado fala – disse o caboclo. O homem obrigou-o a sair, deu-lhe uma sova de chibata e mandou-o carregar água para os depósitos da casa durante o resto da noite. Depois deixou-o sair. Pela tarde de um outro dia, vendo o caboclo, a mulher cumprimentou-o: – Boa tarde, meu cravo, boa tarde, meu amor! O caboclo respondeu, ainda furioso com as chibatadas e as urtigas:
Não sou seu cravo
Nem seu amor.
Tempo de escravo
Já se acabou!
[Sílvio Romero, Contos populares do Brasil, Itatiaia/Editora da Universidade de São Paulo, 1985 (original da 2a ed. de 1897), p.186]

Sou só eu que acho que a única a ganhar nesta história foi a esperta da mulher? Afinal, o marido, ofendido pela “insinuação”, gastou um tempo com o caboclo que, nem se comenta, dançou bonito. A mulher, bem, a mulher escondeu o caboclo embaixo da cama com o consentimento do marido e não levou sova por dar mole ao jovem.

Ah, o folclore…dia destes farei um texto no estilo destas narrativas para explicar um problema de maximização. ^_^…

Anúncios
Uncategorized

Correlação: o que ela não diz?

Muita coisa. Cito:

The real problem comes into play here — the bivariate comparsions selects for the wrong variables by over-emphasizing the relationship between the marginal distributions. Because the selected model is incomplete and important variables are omitted, the resulting parameter estimates are biased and inaccurate.
The bivariate comparsion [sic] is a terrible way to select relevant variables for a highly dimensional model as the function of interest is relating the all of the predictors to the outcome. It can neither rule in nor rule out a predictor from a model. A better approach is to generate the model using domain knowledge and a model of the expected data generating process. If the process is to remain strictly data driven, methods like cross-validation or AIC/BIC provide better measures of model quality and predictor importance than the bivariate correlation coefficient.

Então, você, aluno de Econometria I, que começou a brincar com as regressões múltiplas, esteja avisado: não vá correndo brincar de fazer correlações para “construir” um modelo “a partir do que as correlações dizem”.

É claro que se deve olhar para os dados – não apenas para a teoria – para se construir um modelo. Mas não é lendo uma correlação de maneira incorreta que você conseguirá resolver seu problema.

Eu sei, eu sei, é tentador olhar para as correlações porque a visualização gráfica é sempre interessante. Mas, como sempre alerto aqui, cuidado para não se levar muito a sério. Aliás, quando eu tenho um resultado sério para estudar, eu não publico aqui, eu submeto para uma revista científica. Quando eu tenho algo introdutório, didático ou curioso, aí sim, eu publico aqui.

Obviamente, a função do blog é iniciar discussões mais legais, interessantes e ricas, mas não é um fim em si.

Uncategorized

Rolling Regressions

Let me try and explain the rolling window regression that I have used in my analysis here. Rolling window regression for a timeseries data is basically running multiple regression with different overlapping (or non-overlapping) window of values at a time. For example, if your dataset has values on a timeseries with 100 observations and you want to perform rolling regression, or for that matter any operation on a rolling window, the idea is to start with an initial window of say 40 values(1st to the 40th observation) perform the operation that you wish to and then roll the window with some values, lets say we roll the window by 5. Now, the second window of data would be the next 40 observations starting from the 5th observation (5th to the 45th observation). Similarly, the third window will be the next 40 values starting from the 10th value, and so on. The advantage of using this technique is basically to look at any changing property of a series over time. You will get an estimate of the property over time instead of one single constant measure for the entire period. 

Gostou? Eu também. Mas vou deixar para ver isto depois.

Uncategorized

A escassez de séries de tempo políticas no Brasil…e a (óbvia) relação entre desemprego, inflação e popularidade dos políticos

Estava procurando uma base de dados de popularidade presidencial para fazer um exemplo para meus alunos de Microeconomia III (isso mesmo, você não leu nada errado). Não deu outra: em português, quase nada. Em inglês, descobre-se quem tem alguma coisa.

Então descobri uma dissertação de mestrado em Ciência Política na qual o autor constrói a série. Infelizmente, ele não disponibilizou os dados e, assim, não posso sequer replicar seu estudo. Claro, uma opção é pedir-lhe a base, mas há um outro ponto a se destacar: a escassez de séries de tempo em Ciência Política no Brasil é um sintoma sério de que ainda é preciso muito trabalho para se entender os fenômenos sociais por aqui.

O trabalho do autor é muito interessante. Não é todo dia que vejo alguém da Ciência Política brasileira tentar tratar dados de maneira adequada, usando, por exemplo, testes de raiz unitária. Há alguns, eu sei, mas não os conheço (sequer conheço o autor desta dissertação, por exemplo).

Mas o melhor, para mim, foi constatar que minha tentativa de procurar a série certamente fazia todo sentido. Por que? Bem, veja o que ele conclui:

Quanto aos resultados, encontrou-se que a opinião pública brasileira avalia o trabalho do Presidente a partir do bom desempenho da inflação e do desemprego, sob influencia extraordinária do cenário político. Eventos como mensalão e o apagão tiveram efeitos destacados.

Exatamente. Eu queria fazer um exemplo simples relacionando inflação, desemprego e alguma medida de bem-estar. Como sabemos, isto não é tão fácil. Então eu, pensando naquela idéia antiga e simples de curvas de isovoto, pensei em fazer um exercício que vi, certa vez, na revista Conjuntura Econômica, construindo uma função de utilidade simples. Claro que meu medo era de que as variáveis não tivessem um ajuste bom. Bem, o autor resolveu meu problema. Eu só queria mesmo, agora, era ter acesso aos dados para fazer o exemplo, mas fica para outra vez.

Curiosamente, a dissertação não menciona se houve ou não tentativa de se construir um modelo dinâmico para se medir impactos de curto e longo prazo entre as variáveis (na tradição do VAR com cointegração). Imagino que o tema deve ter sido citado na defesa.

Agora, vejam só, o insight da curva de Phillips – que o ex-presidente negou e depois desmentiu que negou (errar é humano, errar como ex-presidente famoso é menos humano: pega mal, né?) – está lá, bonitinho, bonitinho. Tá tudo lá: desemprego, inflação e popularidade. Quem diria, heim?

p.s. enquanto isto, nos EUA…