Uncategorized

Momento R do Dia – O Passeio Aleatório da Taxa de Câmbio

Vamos fazer um exercício interessante hoje: importar diretamente os dados de um provedor, ao invés de baixá-los para o computador para depois importá-los. Em seguida, vamos verificar um comando simples – mas potencialmente perigoso se mal usado (como diria o tio Ben: grandes poderes são acompanhados de grandes responsabilidades…e eu diria: e eles são complementares perfeitos).

Eis os comandos.

library(tseries)
con if(!inherits(try(open(con), silent = TRUE), "try-error")) {
close(con)
x start = Sys.Date() - 500)
plot(x, main = "USD/BRL")
}
head(x)
library(forecast)
Acf(x)
Pacf(x)
auto.arima(x)

Caso você simplesmente copie e cole, conseguirá repetir todo o exercício. Basta que tenha acesso à internet, certo?

cambio_real_dolar

Ok. Agora, para a segunda parte, veja as funções de autocorrelação e autocorrelação parcial.

acf_real_dolarpacf_real_dolar

É, você que conhece mais de séries de tempo já deve ter ficado meio nervoso com esta fortíssima memória aparente no primeiro gráfico, não é? Mas vamos ignorar este importante aspecto e vamos falar da função auto.arima do R.

Trata-se de um algoritmo que, conforme os critérios de seleção que eu use, pode apresentar este ou aquele modelo como sendo o “melhor” modelo para a série. Então, ok, você descobrirá que:

> auto.arima(x)
Series: x
ARIMA(0,1,0)

sigma^2 estimated as 0.0001772: log likelihood=1447.2
AIC=-2892.4 AICc=-2892.39 BIC=-2888.19

Não sei se você percebeu, mas ele está nos dizendo que o modelo para a taxa de câmbio é exatamente um passeio aleatório (random walk) puro (ou seja, sem drift). Quando a série é um passeio aleatório puro, ou seja, tem raiz unitária, sabemos que a previsão será um desastre, não é? Veja um pouco sobre estes processos aqui (embora meu exemplo seja um passeio aleatório com drift).

Chamei o modelo de random, fiz a previsão e também aproveitei para fazer um diagrama de dispersão entre os resíduos da regressão e a série do câmbio (nosso “x”).

random<-Arima(x,order=c(0,1,0))
summary(random)
plot(forecast(random,h=48))
lines(x,col=2)

library(car)

plot(residuals(random),col=4)
erros<-residuals(random)

# para usar scatterplot, vamos transformar as duas séries em colunas de um
# data frame

frame<-data.frame(erros,x)
scatterplot(frame$erros,frame$x)

Viu só o gráfico que você obteve? Muito ruim, não? Veja a correlação dos resíduos com a série do câmbio.

scatter_cambio

Pois é. Mas será que a taxa de câmbio realmente é um passeio aleatório? Não vou tomar mais seu tempo, mas eu brinquei um pouco com um pacote de detecção de quebras estruturais sem me preocupar muito com o exercício. Sei que o período de tempo é curto, embora a frequência seja alta, e isto sempre pode ser um problema (como explicar quebras em tão curto espaço de tempo?). Eis o que obtive.

quebras_cambioSim, você viu a média da série (em verde) e seis segmentos (portanto, cinco quebras) ao longo do período em questão (os dados se iniciam em 27/10/2012 e vêm até hoje). A grande dificuldade de alguém que estuda uma série de tempo, pelo menos no caso dos economistas, diz respeito a saber se o que se tem aí no gráfico é, de fato, um processo com cinco quebras ou um simples passeio aleatório que, por ser aleatório, de fato, vai aparentar ter quebras (mas pode ser que não as tenha).

Bem, acho que já fiz minha boa ação do dia para os alunos que desejam estudar um pouco de séries de tempo. O restante do trabalho é com você.

 

Uncategorized

宇宙戦艦ヤマト – o Animê

Para quem não conhece, o desenho é uma criação, digamos, conjunta, de Reiji Matsumoto e Yoshinobu Nishizaki. A história da criação em si já é uma polêmica que prejudicou a franquia por anos.

O sucesso da série se deu nos anos 80. Com a briga entre os dois autores, somente em 2009 tivemos o que seria a primeira parte de um filme maior. Com poucos dias de estréia, morre Nishizaki, produtor do filme. Em 2010, o tão esperado live action foi feito, com Takuya Kimura (do SMAP) no papel principal. 

Não é que houve um absoluto silêncio durante os 20 anos. Em 1999, Matsumoto lançou, em PlayStation, trechos em que reinterpreta as temporadas (três, para a TV) e os filmes anteriores (cinco filmes, para cinema e/ou TV).

Finalmente, em 2013, é lançada a reinterpretação da primeira série (que não foi transmitida no Brasil) numa estratégia de divulgação que envolveu três meios de comunicação: cinemas, TV e, claro, DVD/Blu-Ray. É possível levantar as datas exatas dos lançamentos, mas não farei isto agora. Claro, para uma análise mais precisa das buscas no Google Trends, é preciso saber exatamente o que acontece para verificar a mudança no padrão da série, seja na média, seja na variância.

Uma fonte praticamente inesgotável de informações, em inglês, está aqui e dá para ver algumas datas importantes lá, mas é preciso pesquisar em várias das páginas do site. Outro bom lugar para buscar datas importantes é o site oficial da nova série.

Para Iscandar!

Vejamos, portanto, o padrão de buscas por 宇宙戦艦ヤマト(Utyuu Senkan Yamato) no Google japonês (ou seja, as buscas foram feitas no Japão). Lembre-se que a franquia só vai ter alguma retomada em 2009, conforme o super-resumo acima.

yamato

Ok. Vamos usar o pacote car, que é um ótimo ajudante para os que curtem análise de regressão (os autores têm um ótimo livro sobre análise de regressão em R) e vejamos um boxplot desta série.

boxplot_yamato

Ficou bem embolado, né? Repare que, diferente do comando boxplot, do R, este vem com mais informações. A janela de resultados nos diz que há vários pontos que distoam da amostra (lembra do post sobre Taiwan?).

> Boxplot(~new_yamato)
[1] “361” “432” “484” “300” “310” “362” “509” “485” “486” “501”

Estes pontos podem ser analisados na tabela original dos dados. São eles:

2009-09-27 – 2009-10-03 70 300
2009-12-06 – 2009-12-12 68 310
2010-11-28 – 2010-12-04 100 361
2010-12-05 – 2010-12-11 67 362
2012-04-08 – 2012-04-14 86 432
2013-04-07 – 2013-04-13 82 484
2013-04-14 – 2013-04-20 63 485
2013-04-21 – 2013-04-27 59 486
2013-08-04 – 2013-08-10 56 501
2013-09-29 – 2013-10-05 66 509

Pontos de alta busca, não? Acho que o mais correto é buscar informações na internet. Os fãs do desenho bem que poderiam me dar algumas dicas, não?

Podemos verificar outras características da série. Por exemplo, sua estrutura de autocorrelações.

yamato_acf

yamato_pacf

Interessante, não? Eu nunca parei para pensar sobre o padrão de buscas no Google e sua autocorrelação no tempo. O que será que isto significa? Bom, os gráficos parecem mostrar uma forte influência da busca da semana imediatamente anterior sobre a semana atual (para qualquer semana que você olhar, este é o padrão). Há também uma influência positiva, mas muito menor, de buscas de semanas anteriores (para ser específico, de duas semanas anteriores sobre a atual).

Isto poderia nos dizer algo sobre como pensa um consumidor fã deste desenho? Provavelmente sim, mas não vou arriscar palpites. Afinal, a pergunta interessante é se há padrões de autocorrelação similares (ou não) para diferentes tipos de produtos. Eis aí um bom tema de pesquisa para o pessoal que leva marketing a sério.

“- Use o R, Kodai! Use o R!”

Conclusão provisória

Bem, quase não fizemos nada nesta aplicação do R, exceto usar funções dos pacotes carforecast. A dica para você está aí embaixo.

library(car)
library(forecast)
Boxplot(~new_yamato)
plot(new_yamato)
Acf(new_yamato)
Pacf(new_yamato)

Creio que há bastante material para quem quiser trabalhar neste tema. Os fãs do desenho que quiserem me ajudar com datas importantes são bem-vindos. Aqueles que não conhecem o desenho, mas conhecem o R, podem aproveitar para fazer um pouco mais de experiências com os dados.

Confesso que estou sem muita inspiração hoje. Tenho muito trabalho pela frente com uma pequena sobrinha extremamente energética. Então, leitores, o restante do trabalho fica como sugestão para vocês.

20140307_161433

Uncategorized

Confiante em seu futuro?

Gallup acabou de divulgar o índice de confiança econômica dos EUA, estado por estado. A boa notícia é que a notícia poderia ser pior. Em outras palavras, negativo, mas menos. Você pode visualizar o mapa aqui.

Confiança na economia, eu sei, é algo meio etéreo. Do que depende a confiança econômica? Em princípio, de uma infinidade – literalmente – de variáveis. Entretanto, é fácil ver que, com um pouco de correlação, descobre-se que a confiança nas condições econômicas, geralmente, tem a ver com…as condições econômicas, ora bolas! Eu diria que depende do que tem ocorrido e também do que se espera do futuro. Aliás, é assim que boa parte – senão todos – os índices de confiança do consumidor é feita.

Lá vamos nós!

A confiança do consumidor (ou do empresário, ou de um amostra de pessoas) na economia é o que podemos chamar de um índice antecedente no sentido de que ele antecede movimentos da economia. Agora, como a correlação nem sempre é bonita, com um ajuste de 100%, isto significa que a previsão que busca anteceder movimentos dos ciclos econômicos, supostamente dada pelo grau de confiança (ou por sua variação) também não é perfeita (leia o texto do Mark Thoma que citei acima). Veja, por exemplo, o caso do índice de confiança do consumidor da Fecomércio-SP (dados do IPEADATA).

confianca

Quando observamos as variações deste índice em conjunto com as variações do IBC-Br (aquele índice de atividade econômica do Banco Central que, supostamente, é uma proxy do PIB), o que encontramos?

correlacao_conf_ibc

Na melhor das hipóteses, a correlação é muito baixa. Mas, antes de jogar fora o bebê junto com a água, lembre-se que os dados podem conter movimentos sazonais que podem mascarar a relação (ou, para os mais próximos, o sinal) da correlação, caso haja alguma. Aliás, em nosso caso, veja o que acontece quando fazemos um exercício simples, supondo, ora que a confiança é exógena, ora endógena (respectivamente, colunas 1 e 2).

correlacao2

Ok, percebemos que a sazonalidade existe (as variáveis SEASON…) e é significativa, mas a correlação entre as variações da confiança e da atividade econômica desaparecem (ah, depois que publiquei o texto: viu que a sazonalidade nem sempre parece importante quando você muda a variável dependente da regressão? Pois é, não é nenhum teste de exogeneidade, mas é uma boa dica de por onde você deve começar a se preocupar…). Você, com razão, vai me perguntar sobre o porquê disto. Bem, eu diria que há um problema básico nesta tabela que é a de que estamos ignorando a possível autocorrelação que cada uma destas séries, independentemente, pode possuir. Em outras palavras, é possível que o humor do consumidor, neste mês, seja fortemente relacionado com o próprio humor, no mês anterior. O mesmo vale para a atividade econômica.

Acabou a história? Posso entregar o relatório e ganhar nota alta?

Não tão rápido. Uma breve olhadela nas funções de autocorrelação destas variáveis nos diz que pode ser que este seja o caso.

confianca3

A atividade econômica, destacadamente, apresenta um padrão sazonal ainda, mesmo quando observamos a variações da atividade e não seu nível (veja lá a autocorrelação significativa existente nos dados na frequência de doze em doze meses). Algo mais fraco parece existir na confiança, de sete em sete meses.

Pausa para o lanche

Creio que se restou algum leitor por aqui, deve estar já com sono. Mas eis aí uma dica: neste exercício, simples, uma extensão é fazer um modelo ADL com estas duas variáveis. Claro, existe o problema de saber quem (variável exógena) causa quem (variável endógena). Quem conhece mais de séries de tempo poderá sugerir que você saia deste dilema usando uma abordagem de vetores autoregressivos e, bem, a conversa poderia ir mais longe, conforme sua curiosidade quanto à suposta existência de relação entre a confiança do consumidor – note bem, a confiança, não o consumo em si – e a atividade econômica do país.

Certamente, outras perguntas surgirão. Por exemplo: que confiança é esta? A confiança dos empresários é mais importante? O IBC-Br é, de fato, uma proxy da atividade econômica? Eu não deveria olhar os estoques, faturamento ou produção? E esta coisa toda de relacionar variáveis? Não deveríamos incluir mais algumas como a taxa de câmbio, a taxa de juros, etc?

Todas estas perguntas são legítimas, mas significam estender a idéia inicial em direções distintas. Meu objetivo aqui era só falar um pouco da relação entre confiança do consumidor e atividade econômica (e eu nem me aprofundei na metodologia de construção destas variáveis, note bem). Aproveitei para discutir um pouco de econometria aplicada e de que, como sempre, não se deve ser apressado em tirar conclusões com correlações. Aliás, correlação é coisa de aluno de 1o ou 2o ano de uma faculdade que leva 4 anos para se completar e, ainda assim, você sai com o diploma e não pode se arrogar conhecer todos os métodos econométricos.

No final disto tudo, paradoxalmente, talvez você fique mais confiante em seu futuro como economista. Afinal, reconhecer a humildade é, sim, botar os pés no chão. Olhando sempre para o alto e avante, mas com os pés no chão.