Momento R do Dia – Chocolate!

Fazia tempo que não tínhamos um “Momento R do Dia”, né? Pela falta de pedidos, sei que ninguém estava com saudades. Bom, vamos aos fatos. Voltando ao tema do “chocolate”, o Gabriel Sallum, meu ex-aluno, provocou: “- Faz com dieta no Google Trends (ou o Google Correlate)”. A idéia do Gabriel é o sujeito se empaturra com o chocolate em um dia, tem crise de consciência e tenta fazer dieta depois.

A idéia, aliás, era para ser com dados diários. Infelizmente, não os temos para o Brasil lá no Trends. De qualquer forma, conversamos rapidamente (ele estuda ferozmente para as provas da ANPEC e não tem mais tanto tempo quanto antes…quando assistia às minhas aulas, famosas por serem muito fáceis e óbvias).

Como sempre, a provocação surtiu efeito. Eis o código.

dat <- read.table(file="clipboard", header=TRUE, sep="\t", na.string="NA",
                  dec=".")
temp<-ts(dat, start=c(1))
plot(temp)
library(astsa)
lag2.plot(dat$dieta,dat$chocolate,max.lag=12)
lag2.plot(dat$chocolate,dat$dieta,max.lag=12)

Sim, a idéia é que você faça o download dos dados a partir do site do Google Trends e depois copie as colunas e cole no R. Eis uma dica de como obter sua planilha.

chocolate2

As séries? Bem, estão aqui e você já percebe que existem alguns problemas.

dieta_choco

Primeiramente, há um pico na série “dieta”. Em segundo lugar, “chocolate” começa a subir (apresenta algo como uma tendência a partir da observação 400, algo que já comentei antes).

Mesmo assim, em nome da brincadeira, resolvi seguir adiante. Eis o resultado.

dieta_choco2

dieta_choco3

Ok, as correlações não são tão boas, não é? Sem falar que os outliers devem estar atrapalhando. A conclusão de que a correlação seria muito forte entre, digamos, as buscas envolvendo “chocolate” na semana “t” e as que envolvem “dieta” onze semanas antes (a correlação é 0.15, e nem testamos sua significância estatística…) pode não significar nada (análise similar no segundo conjunto de gráficos sofreria da mesma crítica).

Estaria Gabriel errado? Talvez sim, talvez não. Além dos outliers, há o problema de se refinar melhor esta busca lá no Google Trends. Outro ponto importante diz respeito ao fato de que seria interessante filtrar as séries (tendência, sazonalidade…).

De qualquer forma, o desafio do Gabriel continua de pé.

 

 

 

Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s