Uncategorized

Busca de ovos (no google) e busca de galinhas (claro, também no google) e um resultado que mudará o seu jeito de pensar (ou vai te fazer nunca mais voltar a este blog)

O artigo clássico da literatura nacional sobre ovos e galinhas – na minha viesada opinião – é este. Obviamente, trata-se de uma questão muito importante para a vida das pessoas (sem falar que envolve milhares de empregos).

Bem, hoje eu voltei a usar o google trends para fins outros (malignos?) e encontrei este gráfico.

ovosegalinhas

Claro que tive que fazer um teste de causalidade para ver se haveria uma “robustez” do teste de causalidade do artigo citado. Afinal, se ovos (não) Granger-causam galinhas (e vice-versa) com dados do mundo real (produção de ovos e galinhas poedeiras), porque não testar o caso dos impulsos psicológicos que motivam as buscas das palavras “ovos” e “galinhas”? Não foi Keynes quem disse que a função consumo tinha “bases psicológicas”? O Nobel de Economia não foi para um cara que trabalha com esta tal de “motivação psicológica”?

Não perdi tempo! Lá fui eu para o R e, bem, eis as variáveis: x = ovos e y = galinhas (o nome dos eixos, aqui, não tem função alguma, exceto a de tentar dar um ar de seriedade ao post). Um pouco de estimações e eis que posso anunciar o resultado (ao som da banda da praça): para a hipótese nula de que ovos não Granger-causam galinhas, obtive um F = 0.6972 com p-valor de 0.6527. Já para a hipótese de que galinhas não Granger-causam ovos, obtive um F = 2.4705 com p-valor de 0.0325. Traduzindo, a brincadeira gerou um resultado que aponta relativamente mais para a causalidade de ovos para galinhas do que o contrário.

Será este um resultado revolucionário que mudará sua percepção de mundo? Serei chamado (e pago com bitcoins) para palestrar sobre a filosofia, a economia, a diversidade e o bem-estar no Brasil em crise? Não creio. Mas pelo menos foi divertido brincar novamente com o pacote gtrendsR.

Uncategorized

Karl Marx e Adam Smith são como água e óleo? – Momento R do Dia

Será que a busca pelo verbete “Karl Marx” na Wikipedia (em língua inglesa) tem algo a ver com a busca do verbete “Adam Smith” na mesmíssima Wikipedia? Sei lá. Vai que alguém mandou fazer um trabalho de História do Pensamento Econômico…

Pois é. Eu resolvi brincar com os dados e fiz um teste de causalidade (o “água e óleo” do título). As dicas do R aqui são: como importar dados irregulares (usando o pacote zoo) e também como fazer o teste de Granger (há vários jeitos, usei o pacote lmtest).

# Exemplo do marxismo
# Os dados foram baixados da Wikipedia seguindo o exemplo em: 
# http://www.r-datacollection.com/blog/Using-wikipediatrend/
# Depois, levei os dados para o Excel e arrumei a base. 
# Importei as duas séries para o R.

marxism <- read.zoo("C:/Users/cdshi_000/Documents/Meus Documentos/Meus Documentos/smithmarx.csv",header=TRUE,sep=",",format = "%m/%d/%Y")
head(marxism)
summary(marxism)
plot(marxism$Karl_Marx)

# o gráfico acima foi só para checagem.
# Será que há Granger-causalidade?
# Brinquei com vários lags.

library(lmtest)

grangertest(Karl_Marx~Adam_Smith, order=5, data=marxism)
grangertest(Adam_Smith~Karl_Marx, order=5, data=marxism)

grangertest(Karl_Marx~Adam_Smith, order=8, data=marxism)
grangertest(Adam_Smith~Karl_Marx, order=8, data=marxism)

grangertest(Karl_Marx~Adam_Smith, order=10, data=marxism)
grangertest(Adam_Smith~Karl_Marx, order=10, data=marxism)

grangertest(Karl_Marx~Adam_Smith, order=20, data=marxism)
grangertest(Adam_Smith~Karl_Marx, order=20, data=marxism)

Pois é, gente. Eu bem que tentei. Mas, claro, eu fiz isso para a Wikipedia em língua inglesa. Será que os resultados seriam os mesmos na Wikipedia de língua portuguesa? Tenho minhas dúvidas. Claro, faltou um bocado de coisa, mas não estou fazendo nada muito sério.

Repare na entrada dos dados. Na minha planilha, a data tem o formato tal e qual este exemplo: “1/30/2008”. Repare no código, lá no início, como eu digo exatamente isto ao R. Esta é a dica das datas que vale a pena guardar.

Bom, não deu causalidade nas estruturas de defasagem que, arbitrariamente, adotei. Só uma brincadeira, mas divertida. ^_^

Uncategorized

Função de Correlação Cruzada e a Galinha Pintadinha (Pópópó!)

Como é que é? Função de Correlação Cruzada? Quem aprendeu modelos ARIMA na graduação não deve ter ouvido falar dela. Só quando a turma acompanha a literatura, adianta-se ao material e aprofunda nos estudos é que o conceito surge. Ou seja, não é para todas as turmas que você tem a oportunidade de conversar sobre o tema (eventualmente, ex-alunos que leram o livro do Walter Enders saberão que o conceito está lá, explicado, em algum lugar…).

A melhor explicação rápida que já vi é a deste post. Citando:

The CCF is defined as the set of correlations (height of the vertical line segments in Fig. 2) between two time series xt+h and yt for lags h=0,±1,±2,. A negative value for h represents a correlation between the x-series at a time before t and the y-series at time t. If, for example, the lag h=3, then the cross correlation value would give the correlation between xt3 and yt. Negative line segments correspond to events that are anti-correlated.

The CCF helps to identify lags of xt that could be predictors of the yt series.

  1. When h<0 (left side of plots in Fig. 2), x leads y.

  2. When h>0 (right side of plots in Fig. 2), x lags y.

Pois é. Você entendeu. É fácil de fazer algo rápido.

Bom, se você leu o texto deve ter notado que o autor analisa temperaturas em algumas cidades da Austrália. Eu, como me preocupo com problemas mais relevantes para a filosofia, gosto de pensar em questões como esta (baseado no original de 1988).

Pois é. Ovo ou galinha? Quem vem primeiro? A pergunta geralmente é estudada com testes de causalidade de Granger (leia o artigo, ora bolas…), mas podemos dar uma olhada nas correlações cruzadas (estou olhando os níveis das séries: número de galinhas e mil dúzias de ovos). Os dados são relativos ao Brasil (a fonte é o IBGE e as séries foram construídas a partir de uma amostra original mensal no intervalo delimitado entre Jan/1987 e Dez/2013).

ovos6

Repare que há uma simetria e, portanto, basta olhar para um dos dois gráficos. A maior correlação cruzada ocorre em h = 0, que mostraria que não há precedência temporal de uma série sobre a outra. Aparentemente, as duas caminham juntas (a correlação é contemporânea, nem defasada, nem antecipada).

Acha que é assim em qualquer amostra? Não para os EUA (dados anuais, 1930-1983).

ovos_eua

Neste caso, a correlação é negativa e olhamos para o valor mínimo. em h = 13 e 14. Há precedência temporal entre as séries? Há e o pessoal que gosta do teste de Granger já deve estar retornando ao início deste texto. Para ser mais preciso, a gente tinha que ter os dados na mesma frequência. Aí a brincadeira ficaria mais interessante. Mas já é tarde e meus leitores (boa parte deles) está estudando para as provas. Então, fica para outro dia.

Os comandos em R são fáceis. Você pode replicar o que o blogueiro citado fez. É exatamente o que eu fiz aqui. Vou ajudar você com a base de dados original (embora os dados não sejam exatamente os mesmos, como se elucida aqui).

library(lmtest)
data(ChickEgg)
summary(ChickEgg)
plot(ChickEgg)
?ChickEgg
series<-ts(ChickEgg, start=c(1930), freq=1)
plot(series)
head(series)
chicken<-series[,c(1)]
eggs<-series[,c(2)]
head(chicken)
ccf(chicken,eggs, plot=FALSE)
pm<-ccf(eggs,chicken)
max.pmc <- max(pm$acf)
max.pmc
pm$lag[which(pm$acf > max.pmc-0.01 & pm$acf < max.pmc+0.01)]

Ok, não fizemos o teste de causalidade de Granger hoje, mas as dicas ao longo deste post já são suficientes para você tentar em casa, sem a supervisão de adultos.

Faz um teste de causalidade de Granger, faz! Pópópó!
Uncategorized

Quem veio primeiro: o ovo ou a galinha?

Pairwise Granger Causality Tests
Date: 08/27/08   Time: 14:51
Sample: 2006M01 2008M03
Lags: 2

Null Hypothesis:                                               Obs    F-Statistic    Probability

CHICKENS does not Granger Cause EGGS            25     6.36383     0.00726
EGGS does not Granger Cause CHICKENS                      0.25971     0.77383

Dados do IBGE e replicando – inclusive no humor e na falta de rigor – o clássico de 1988:

Chickens, Eggs, and Causality, or Which Came First? – Walter N. Thurman and Mark E. Fisher
Source: American Journal of Agricultural Economics, Vol. 70, No. 2, (May, 1988), pp. 237-238