Uncategorized

宇宙戦艦ヤマト – o Animê

Para quem não conhece, o desenho é uma criação, digamos, conjunta, de Reiji Matsumoto e Yoshinobu Nishizaki. A história da criação em si já é uma polêmica que prejudicou a franquia por anos.

O sucesso da série se deu nos anos 80. Com a briga entre os dois autores, somente em 2009 tivemos o que seria a primeira parte de um filme maior. Com poucos dias de estréia, morre Nishizaki, produtor do filme. Em 2010, o tão esperado live action foi feito, com Takuya Kimura (do SMAP) no papel principal. 

Não é que houve um absoluto silêncio durante os 20 anos. Em 1999, Matsumoto lançou, em PlayStation, trechos em que reinterpreta as temporadas (três, para a TV) e os filmes anteriores (cinco filmes, para cinema e/ou TV).

Finalmente, em 2013, é lançada a reinterpretação da primeira série (que não foi transmitida no Brasil) numa estratégia de divulgação que envolveu três meios de comunicação: cinemas, TV e, claro, DVD/Blu-Ray. É possível levantar as datas exatas dos lançamentos, mas não farei isto agora. Claro, para uma análise mais precisa das buscas no Google Trends, é preciso saber exatamente o que acontece para verificar a mudança no padrão da série, seja na média, seja na variância.

Uma fonte praticamente inesgotável de informações, em inglês, está aqui e dá para ver algumas datas importantes lá, mas é preciso pesquisar em várias das páginas do site. Outro bom lugar para buscar datas importantes é o site oficial da nova série.

Para Iscandar!

Vejamos, portanto, o padrão de buscas por 宇宙戦艦ヤマト(Utyuu Senkan Yamato) no Google japonês (ou seja, as buscas foram feitas no Japão). Lembre-se que a franquia só vai ter alguma retomada em 2009, conforme o super-resumo acima.

yamato

Ok. Vamos usar o pacote car, que é um ótimo ajudante para os que curtem análise de regressão (os autores têm um ótimo livro sobre análise de regressão em R) e vejamos um boxplot desta série.

boxplot_yamato

Ficou bem embolado, né? Repare que, diferente do comando boxplot, do R, este vem com mais informações. A janela de resultados nos diz que há vários pontos que distoam da amostra (lembra do post sobre Taiwan?).

> Boxplot(~new_yamato)
[1] “361” “432” “484” “300” “310” “362” “509” “485” “486” “501”

Estes pontos podem ser analisados na tabela original dos dados. São eles:

2009-09-27 – 2009-10-03 70 300
2009-12-06 – 2009-12-12 68 310
2010-11-28 – 2010-12-04 100 361
2010-12-05 – 2010-12-11 67 362
2012-04-08 – 2012-04-14 86 432
2013-04-07 – 2013-04-13 82 484
2013-04-14 – 2013-04-20 63 485
2013-04-21 – 2013-04-27 59 486
2013-08-04 – 2013-08-10 56 501
2013-09-29 – 2013-10-05 66 509

Pontos de alta busca, não? Acho que o mais correto é buscar informações na internet. Os fãs do desenho bem que poderiam me dar algumas dicas, não?

Podemos verificar outras características da série. Por exemplo, sua estrutura de autocorrelações.

yamato_acf

yamato_pacf

Interessante, não? Eu nunca parei para pensar sobre o padrão de buscas no Google e sua autocorrelação no tempo. O que será que isto significa? Bom, os gráficos parecem mostrar uma forte influência da busca da semana imediatamente anterior sobre a semana atual (para qualquer semana que você olhar, este é o padrão). Há também uma influência positiva, mas muito menor, de buscas de semanas anteriores (para ser específico, de duas semanas anteriores sobre a atual).

Isto poderia nos dizer algo sobre como pensa um consumidor fã deste desenho? Provavelmente sim, mas não vou arriscar palpites. Afinal, a pergunta interessante é se há padrões de autocorrelação similares (ou não) para diferentes tipos de produtos. Eis aí um bom tema de pesquisa para o pessoal que leva marketing a sério.

“- Use o R, Kodai! Use o R!”

Conclusão provisória

Bem, quase não fizemos nada nesta aplicação do R, exceto usar funções dos pacotes carforecast. A dica para você está aí embaixo.

library(car)
library(forecast)
Boxplot(~new_yamato)
plot(new_yamato)
Acf(new_yamato)
Pacf(new_yamato)

Creio que há bastante material para quem quiser trabalhar neste tema. Os fãs do desenho que quiserem me ajudar com datas importantes são bem-vindos. Aqueles que não conhecem o desenho, mas conhecem o R, podem aproveitar para fazer um pouco mais de experiências com os dados.

Confesso que estou sem muita inspiração hoje. Tenho muito trabalho pela frente com uma pequena sobrinha extremamente energética. Então, leitores, o restante do trabalho fica como sugestão para vocês.

20140307_161433

Anúncios
Uncategorized

Ainda não morri (madadayo)

20140307_132747

「親譲りの無鉄砲で子供の時から損ばかりしている。」

Ou, em inglês (e você pode traduzir facilmente): Ever since I was a child, my inherent recklessness has brought me nothing but trouble.

Esta é exatamente a primeira frase do clássico da literatura japonesa, Botchan, de Natsume Souseki, publicado no Japão de 1905. Eu me lembro da primeira vez em que tive contato com a história. Foi em um dos filmes que a nossa colônia trazia e exibia no auditório do Banco Nacional, ali na Rua Espírito Santo logo após a Avenida Afonso Pena.

Acho que a última coisa importante nesta história é a rotina do professor, nosso “Botchan”, um termo de difícil tradução, mas que carrega um tom irônico já que se refere a um adulto. Não sei como e nem o porquê, mas sempre que experimento momentos de intensa alegria junto a ex-alunos, eu me lembro de Botchan, desta frase e também do clássico do Kurosawa – e último filme dele – Madadayo. Quanto a este, não é difícil entender o porquê de momentos como este me lembrarem do filme. Mas há algo que não consigo entender acerca de meus sentimentos quanto à primeira frase de Botchan.

Tentarei algumas hipóteses para acalmar um pouco de minha alma confusa.

Botchan (坊ちゃん) – hipóteses

H.1 – Eu queria ter sido mais cabeça dura quando criança.

Talvez a leitura desta frase invoque em mim uma frustração acerca da minha infância. Eu deveria ter sido mais cabeça dura, brigado um pouco mais do que briguei quando criança. Mas como isso me ajudaria a entender a relação da frase com a profissão de lecionar? Botchan não era bem meu modelo de ensino. Não há dicas de pedagogia no livro. A relação com os alunos é simples, bem no estilo tradicional de outras histórias japonesas sobre a vida escolar. A trama toda está entre o professor maquiavélico, seu serviçal e os outros dois professores, vítimas destes. Claro, Botchan está inserido nesta trama de um jeito que …deixa para lá. Você tem que ler o livro.

H.2 – A frase evoca a atuação de Botchan, lutando para crescer como ser humano

Pode até ser. Mas o que tem isso a ver com lecionar? Ok, eu sei que tem muito a ver, mas na época em que vi o filme eu era muito jovem. Devia estar no colégio ou algo assim. É verdade que só fui ler o livro depois, em inglês, com uns 14 anos de intervalo. Afinal, a economia não era muito globalizada e não era fácil encontrar este livro por aí. Só em São Paulo, e em livrarias especializadas. Como eram tristes os anos pré-abertura…a cultura do brasileiro não se comparava ao que temos hoje, com funk e tudo o mais. Basta querer e você lê praticamente quase tudo…em inglês. É, não melhorou tanto assim.

H.3 – A atitude de Botchan é um símbolo do contraditório…mas importante

Ao me sentar à mesa com meus alunos eu vi o quanto eu tive de lutar para melhorar um curso (um dia eu conto para vocês a história da biblioteca que “escondia” os textos para discussão…). Foram anos de muito envolvimento emocional com um projeto que não vingou. É uma história longa, que ainda será contada em detalhes para alguns, em outros almoços, jantares ou cafés. Coisa para amigos. Sim. Envelheci. Tenho memórias de projetos que deram certo, outros que fracassaram.

Vou contar uma coisa: era preciso ter atitude. Não bastava seguir as regras porque muitos que faziam as regras não as cumpriam. Graças a nosso trabalho, introduzimos o sistema de monitorias e, um belo dia, um aluno – bem conhecido por sua reduzida capacidade de estudar… – veio se queixar: achava um absurdo ter que ir à monitoria, já que pagava a faculdade. Como? Não, você não leu incorretamente. Foi exatamente isto.

Então, ficamos com H.3 (o teste de hipóteses, o erro tipo I, tipo II e… a pizza)

É, acho que é isto. Conversar com o Helger, Ronaldo, Juliana, Igor e Aurea naquela mesa me lembrou que, pela atitude deles, em muitos momentos, eu notei que precisava ser um pouco mais firme. Ser educado demais é confundido, por imbecis, com ser covarde. Para ajudar os alunos a descobrirem o seu próprio caminho, é necessário, paradoxalmente, ensinar um caminho. Digamos, uma metodologia, um “meta-caminho”. Para todos eles, e tantos outros ao longo dos anos, houve puxões de orelha, conselhos, bengalas, placas de sinalização, empurrões, sorrisos e, bem, acho que é isto que esta frase inicial evoca.

A luta para ensinar bem não é fácil. Nem o professor é perfeito – longe disto – mas o importante é que, após tudo isto, as pessoas aprendam que não se confunde o professor com o colega: há respeito. Mas também há uma amizade – e eu reconheço que sou péssimo para amizades, um defeito congênito, creio – que, plantada, eventualmente brota aqui e ali.

Citando Mário de Andrade (para variar…)

Cada um dos meus ex-alunos nesta foto tem uma história de vida. Um deles, inclusive, acaba de ampliá-la com um filho. Quanta alegria pode um ex-professor pode sentir ao testemunhar tanta homenagem à vida? Não sei. Mas sei que beira ao infinito (positivo).

Bem, o Ronaldo me disse que repetiríamos a dose se a foto viesse para o blog. Então, já viu, né? Meu interesse maximizador e auto-interessado me trouxe para esta foto, este texto e, não vou mentir, a muitas recordações.

Eis minha comemoração, rememorando Mário de Andrade, que era uma leitura confusa e interessante nos meus tempos de aluno que, sim, subia a rua da Bahia para o estágio e, depois, voltava para casa por diversos caminhos, conforme o que havia para fazer:

Alegria da noite de Belo Horizonte!
Ha uma ausencia de males
Na jovialidade infantil do friozinho.
Silêncio brincalhão salta das árvores,
Entra nas casas desce as ruas paradas
E se engrossa agressivo na praça do Mercado. [Mário de Andrade, “Noturno de Belo Horizonte” (trecho), 1934]

Este Mário de Andrade precisava mesmo era ter dado aulas por aí. De certa forma, ele as deu. Ou não aprendemos nada com este belo trecho? Nosso Nazaré tem um filho. Não é a cidade que sorri ao nascimento de mais um novo cruzeirense?

Pois então, Ronaldo. Cumpri a promessa. Quando é a próxima pizza?

Uncategorized

A bolsa em Taiwan, os pontos influentes: mais um “Momento R do Dia”

Sim, hoje é dia de Taiwan. Vamos aproveitar que o Banco Central de Taiwan (sim, ele existe!) disponibiliza alguns dados para brincar um pouco. Vamos olhar para a tabela 28:

28.Stock Market -B.Transactions of Listed Stock and Stock Price – Monthly by Period, Items and Types

taiwan1

Vamos imaginar que eu tenha um bom motivo teórico para imaginar que esta série possa ser estimada pelo modelo abaixo. Vamo ao resultado.

Time series regression with “ts” data:
Start = 1987(7), End = 2014(2)

Call:
dynlm(formula = log(stock_amount) ~ L(log(stock_amount), 1))

Residuals:
Min    1Q            Median      3Q           Max
-0.31752    -0.04385   0.00005    0.04253   0.31459

Coefficients:
Estimate   Std. Error   t value  Pr(>|t|)
(Intercept)                          0.52853   0.13001     4.065   6.05e-05 ***
L(log(stock_amount), 1)   0.94003   0.01488     63.179   < 2e-16 ***

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.08254 on 318 degrees of freedom
Multiple R-squared: 0.9262, Adjusted R-squared: 0.926
F-statistic: 3992 on 1 and 318 DF, p-value: < 2.2e-16

Bonito, né? Faz aí seu checklist sobre o que falta fazer com esta regressão. Fez? Ok. Mas vamos explorar outro aspecto do R hoje. Vamos falar um pouco da distância de Cook e de pontos influentes. Deste link temos que:

In statisticsCook’s distance or Cook’s D is a commonly used estimate of the influence of a data point when performing least squares regression analysis.[1] In a practical ordinary least squares analysis, Cook’s distance can be used in several ways: to indicate data points that are particularly worth checking for validity; to indicate regions of the design space where it would be good to be able to obtain more data points. It is named after the American statistician R. Dennis Cook, who introduced the concept in 1977.

Ok, então, estamos diante de um ponto “influente”, na definição de Cook, quando algum ponto “parece” distoar da distribuição dos dados. Não é necessariamente um outlier porque, segundo dizem, para este não existe uma definição precisa. Bom, o problema não desaparece só porque não demos um nome a ele. Confuso? Vamos pesquisar mais. Primeiro, vejamos algumas definições.

The influence of an observation can be thought of in terms of how much the predicted scores for other observations would differ if the observation in question were not included. Cook’s D is a good measure of the influence of an observation and is proportional to the sum of the squared differences between predictions made with all observations in the analysis and predictions made leaving out the observation in question.

Ok, já temos algo. Uma medida de influência, portanto, caso seja retirada da amostra, pode alterar o valor dos coeficientes estimados. Perigoso aqui e em Taiwan. Mais uma definição.

The leverage of an observation is based on how much the observation’s value on the predictor variable differs from the mean of the predictor variable. The greater an observation’s leverage, the more potential it has to be an influential observation. For example, an observation with a value equal to the mean on the predictor variable has no influence on the slope of the regression line regardless of its value on the criterion variable. On the other hand, an observation that is extreme on the predictor variable has the potential to affect the slope greatly.

Mesmo que você não estude estas medidas, ou mesmo que não tenha lido ainda sobre isto, o diagnóstico da regressão, no R, quebra um bom galho neste caso. Após fazer a regressão acima, peço um plot e sou apresentado há vários gráficos de diagnósticos, um deles o que se segue.

cooktaiwan

Repare que temos, no eixo vertical, os resíduos da regressão padronizados e, no eixo horizontal, a medida de leverage (uma aula sobre este e outros gráficos aqui). Repare que não há nenhum ponto nas regiões da distância de Cook (as linhas vermelhas pontilhadas). Há alguns pontos indicados lá. São potencialmente perigosos.

Por meio do pacote car, obtenho uma visualização um pouco distinta.

taiwancook2

As áreas das bolinhas são proporcionais à distância de Cook. Parece que Outubro de 1987 é um ponto a ser estudado com calma.

Ok, já deu para perceber que o Momento R do Dia vai terminar de forma incompleta, né? Não vamos nos aprofundar nesta análise de outliers e afins hoje. Voltaremos ao tema assim que eu tiver tempo de organizar um texto didático sobre o assunto, ok?

Neste meio tempo, você pode ir estudando e, claro, fique com os comandos.

tai<-dynlm(log(stock_amount)~L(log(stock_amount),1))
summary(tai)
plot(tai)
library(car)
influencePlot(tai)

Eu recomendo fortemente que você pesquise sobre o tema e, sim, eu não me preocupei com outros aspectos desta regressão ingênua. Mas, você notou que eu estava pensando em um passeio aleatório por Taiwan quando estimei aquilo lá?

                                           Cook’s D………..uck!