Para quem não conhece, o desenho é uma criação, digamos, conjunta, de Reiji Matsumoto e Yoshinobu Nishizaki. A história da criação em si já é uma polêmica que prejudicou a franquia por anos.
O sucesso da série se deu nos anos 80. Com a briga entre os dois autores, somente em 2009 tivemos o que seria a primeira parte de um filme maior. Com poucos dias de estréia, morre Nishizaki, produtor do filme. Em 2010, o tão esperado live action foi feito, com Takuya Kimura (do SMAP) no papel principal.
Não é que houve um absoluto silêncio durante os 20 anos. Em 1999, Matsumoto lançou, em PlayStation, trechos em que reinterpreta as temporadas (três, para a TV) e os filmes anteriores (cinco filmes, para cinema e/ou TV).
Finalmente, em 2013, é lançada a reinterpretação da primeira série (que não foi transmitida no Brasil) numa estratégia de divulgação que envolveu três meios de comunicação: cinemas, TV e, claro, DVD/Blu-Ray. É possível levantar as datas exatas dos lançamentos, mas não farei isto agora. Claro, para uma análise mais precisa das buscas no Google Trends, é preciso saber exatamente o que acontece para verificar a mudança no padrão da série, seja na média, seja na variância.
Uma fonte praticamente inesgotável de informações, em inglês, está aqui e dá para ver algumas datas importantes lá, mas é preciso pesquisar em várias das páginas do site. Outro bom lugar para buscar datas importantes é o site oficial da nova série.
Para Iscandar!
Vejamos, portanto, o padrão de buscas por 宇宙戦艦ヤマト(Utyuu Senkan Yamato) no Google japonês (ou seja, as buscas foram feitas no Japão). Lembre-se que a franquia só vai ter alguma retomada em 2009, conforme o super-resumo acima.
Ok. Vamos usar o pacote car, que é um ótimo ajudante para os que curtem análise de regressão (os autores têm um ótimo livro sobre análise de regressão em R) e vejamos um boxplot desta série.
Ficou bem embolado, né? Repare que, diferente do comando boxplot, do R, este vem com mais informações. A janela de resultados nos diz que há vários pontos que distoam da amostra (lembra do post sobre Taiwan?).
> Boxplot(~new_yamato)
[1] “361” “432” “484” “300” “310” “362” “509” “485” “486” “501”
Estes pontos podem ser analisados na tabela original dos dados. São eles:
2009-09-27 – 2009-10-03 | 70 | 300 |
2009-12-06 – 2009-12-12 | 68 | 310 |
2010-11-28 – 2010-12-04 | 100 | 361 |
2010-12-05 – 2010-12-11 | 67 | 362 |
2012-04-08 – 2012-04-14 | 86 | 432 |
2013-04-07 – 2013-04-13 | 82 | 484 |
2013-04-14 – 2013-04-20 | 63 | 485 |
2013-04-21 – 2013-04-27 | 59 | 486 |
2013-08-04 – 2013-08-10 | 56 | 501 |
2013-09-29 – 2013-10-05 | 66 | 509 |
Pontos de alta busca, não? Acho que o mais correto é buscar informações na internet. Os fãs do desenho bem que poderiam me dar algumas dicas, não?
Podemos verificar outras características da série. Por exemplo, sua estrutura de autocorrelações.
Interessante, não? Eu nunca parei para pensar sobre o padrão de buscas no Google e sua autocorrelação no tempo. O que será que isto significa? Bom, os gráficos parecem mostrar uma forte influência da busca da semana imediatamente anterior sobre a semana atual (para qualquer semana que você olhar, este é o padrão). Há também uma influência positiva, mas muito menor, de buscas de semanas anteriores (para ser específico, de duas semanas anteriores sobre a atual).
Isto poderia nos dizer algo sobre como pensa um consumidor fã deste desenho? Provavelmente sim, mas não vou arriscar palpites. Afinal, a pergunta interessante é se há padrões de autocorrelação similares (ou não) para diferentes tipos de produtos. Eis aí um bom tema de pesquisa para o pessoal que leva marketing a sério.

Conclusão provisória
Bem, quase não fizemos nada nesta aplicação do R, exceto usar funções dos pacotes car e forecast. A dica para você está aí embaixo.
library(car) library(forecast) Boxplot(~new_yamato) plot(new_yamato) Acf(new_yamato) Pacf(new_yamato)
Creio que há bastante material para quem quiser trabalhar neste tema. Os fãs do desenho que quiserem me ajudar com datas importantes são bem-vindos. Aqueles que não conhecem o desenho, mas conhecem o R, podem aproveitar para fazer um pouco mais de experiências com os dados.
Confesso que estou sem muita inspiração hoje. Tenho muito trabalho pela frente com uma pequena sobrinha extremamente energética. Então, leitores, o restante do trabalho fica como sugestão para vocês.