Momento R do Dia – furacões ou “Uma imagem vale mais do que mil palavras, mas qual imagem é esta? – a pergunta de um milhão (de imagens)”

Tufões e R

Dos dois posts anteriores sobre as cerejeiras obtive também a série de ocorrências de tufões no Japão. Vale a pena a gente olhar os gráficos para perceber o quão enganador pode ser um gráfico. Por exemplo, vou mostrar inicialmente os gráficos dos dados mensais e trimestrais. Por que? Porque há meses em que não ocorrem tufões. Assim, para evitar a ocorrência de zeros no gráfico, posso observar o trimestre.

Eis os gráficos.

tuf1

 

tuf2

Percebe que o gráfico dá a impressão de uma certa estacionaridade em torno da média, né? Mas será que estes gráficos nos mostram uma série com média e variância constantes? Alguém poderia fazer uma tabela com os dados e com alguns poucos testes de igualdade de média (ou de variância), chegaria em uma resposta. Uma opção é olharmos para os gráficos de meses ou trimestres (já usados em outros “Momentos R do Dia” neste blog).

tuf3

tuf4

Ambos os gráficos nos dizem que há uma diferença nas médias, não? Na frequência mensal isto pode ficar mais suavizado, mas, no caso trimestral, o terceiro trimestre é um sujeitinho bem diferenciado em termos de média, não?

Agora, o interessante é notar que os gráficos originais não são tão claros no sentido de nos mostrar este padrão diferenciado. Que tal irmos um pouco além?

tuf5

tuf6

Vejam só. Com as funções de autocorrelação percebemos mais uma outra característica: a agregação dos dados (mensal para trimestral) altera o formato destas funções. Isto pode não ser intuitivo para alguns e vale a pena destacar o ponto (embora muita gente ache isto intuitivo, eu nunca achei e teria agradecido se alguém tivesse me chamado a atenção para o ponto).

Conclusão

Então, sim, uma imagem pode ser de muita ajuda para entendermos a realidade. É essencial que a imagem ou, no caso, o gráfico, seja muito bem apresentado. Mas existe uma pergunta muito importante: qual gráfico nos informa, de fato, mais sobre o que desejamos saber?

A resposta, portanto, depende do que desejamos saber. A moral da história é que quanto mais gráficos você aprender (ou melhor: quanto mais flexibilidade você tiver), melhor. Eu? Eu desejo saber se você aprendeu a fazer todos os tipos de gráficos no R. Assim, eis os comandos (após importar os dados, claro):


library(ggplot2)
library(lattice)
library(latticeExtra)

# nao usei este grafico...
xyplot(taifu,
       main="Furacões no Japão",
       ylab="furacões no mês", xlab="Mês/Ano",
       scales = list(y = list(relation= "free")))

#agregando para trimestres...

taifu.Q<-aggregate(taifu,nfrequency=4)

#checando 

show(taifu.Q)

# os graficos do post

plot(taifu,col="orange",xlab="meses",ylab="ocorrências",main="Tufões no Japão")
plot(taifu.Q,, col="red",xlab="trimestres",ylab="ocorrências",main="Tufões no Japão")
monthplot(taifu.Q, col="red",ylim=c(min(taifu.Q),max(taifu.Q+1)),main="Tufões no Japão",xlab="trimestres",ylab="ocorrências")
monthplot(taifu, col="orange",ylim=c(min(taifu),max(taifu)),main="Tufões no Japão",xlab="meses",ylab="ocorrências")

library(forecast)
tsdisplay(taifu)
tsdisplay(taifu.Q)

Ok, até a próxima. Voltarei com o exercício de expectativas racionais, assim que a Roseli e eu acertarmos como faremos esta divertida brincadeira inter-blogs.

Domingo é dia de ir ao cinema

Pois é. E que filme eu gostaria de assistir? Não sei. Mas desconfio que cinema é um bom assunto para um post de economia aplicada (com, sim, dicas de R). Com a ajuda da MPPAJ, eu descobri algumas coisas interessantes sobre o cinema…no Japão.

new new celular3Sou de uma época em que filmes eram vistos, primeiro, no cinema e, muito tempo depois, na televisão. Aí veio o vídeo-cassete e, depois, o DVD (e o Blu-Ray) que diversificaram as opções da indústria de filmes (há filmes que, mesmo que não consigam uma sala para exibição, podem aparecer em DVD e, claro, há as produções exclusivas para a televisão como, por exemplo, o Battlestar Galactica Razor que nunca foi ao cinema).

Aliás, repare como é o processo de mercado (valhei-me, São Hayek!): originalmente, a indústria não tinha uma noção tão precisa de se o vídeo-cassete e o cinema seriam complementares ou substitutos. Claro que a tecnologia era usada para facilitar a vida de quem produzia programas de TV, mas os impactos do vídeo-cassete sobre o cinema não podem ser analisados de forma isolada. Bem, a história da tecnologia dos meios de comunicação nos diz que, penso eu, este é um dos setores mais imprevisíveis.

Na minha época, achávamos, por exemplo, que o vídeo-cassete era uma opção segura de assistir filmes em uma sociedade em que a violência nas ruas começava a aparecer como um problema para os nossos pais.

Você não estava lá…mas eu estava (exceto que era o Brasil, não o Japão)!

Como disse acima, quando surgiram estas inovações – começando com o vídeo-cassete – como é de se imaginar, o mercado de distribuição de filmes sofreu uma boa chacoalhada. Ainda era verdade que filmes saíam primeiro nos cinemas e, só muito depois, em fita. Mas aqueles mais pacientes intertemporalmente podiam escolher consumir o filme depois. Isto foi lá na primeira metade da década dos 80. Sim, leitor(es/as), a taxa de desconto intertemporal é uma variável importante! Em outras palavras, há pessoas mais impacientes (querem consumir logo!) e os pacientes. Aliás, nos EUA, editoras ganham um bom dinheiro lançando livros-texto de capa dura rapidamente e os de capa comum, com algum lapso de tempo: há quem pague mais para ter o livro em capa dura, creia-me.

Mas, voltando aos filmes – hoje é domingo, dia de cinema, não de estudar (para mim, tanto faz, mas…) – claro, o mercado no qual a mudança ocorreu primeiro foi o japonês (onde você acha que inventaram esta história de vídeo-cassete?). Vejamos o que dizem os dados do número de salas de cinema no Japão desde o pós-guerra.

moviesjapan

Percebe-se que a tendência foi de queda – não sem oscilações marcantes – desde o pós-guerra até mais ou menos a década dos 70. Com a chegada do VHS, a tendência de queda não parece ter se alterado, exceto que a queda ficou mais regular (no sentido de não apresentarem oscilações tão fortes). Será que a TV já concorria com o cinema? Duvido um pouco disto porque se há uma relação entre cinema e TV ela não é tão fortemente substituta (lançamentos de filmes não concorrem com a novela das oito ou com filmes antigos). Bom, mas vamos em frente.

O movimento de queda parece sofrer uma reversão nos anos 90. Muitos achavam que o cinema tinha morrido – este era o discurso dos meus amigos, aqui no Brasil – e os mais pessimistas vislumbravam um mundo de pessoas isoladas, vendo filmes em casa até que, ironicamente, surgiu a internet e o suposto “isolamento” foi solapado pelas “ameaças desconhecidas aos nossos filhos” que o novo meio de comunicação trouxe. Em outras palavras, ninguém mais temia o isolamento. Muitos antes pelo contrário. Assim, percebe-se no gráfico um ressurgimento das salas de cinema na terra de Akira Kurosawa. Parece legal, não? Godzilla ressurge?

Mais TV, menos filhos?

Não se esqueça que, além do vídeo-cassete, há que se considerar o público destas salas: por que abrir salas se não há público? Ou seja, como andou a população japonesa no período? Desde o pós-Meiji (era Taishou – 大正) até o período mais recente, você observa uma progressiva diminuição no crescimento da densidade populacional e isto não é porque japoneses estão emigrando: é porque a natalidade está estacionando, se não diminuindo). Veja só o gráfico da densidade…(caso ele não carregue, eis o link)

Densidade populacional

…e o da população (variação anual).

japao_pop

Queda livre depois da década dos 70, não? Em termos de ingressos vendidos, temos o seguinte gráfico:

ingressos

Bem, podemos ver que os dias gloriosos do cinema japonês são passado. O que temos é um renascimento bem mais modesto. Claro, eu não poderia falar destes gráficos sem citar o preço do ingresso e a a MPPAJ tem uma variável que é o “preço médio do ingresso”. Senta que lá vem gráfico!

ingresso

O comportamento do preço médio é de estabilização, não? Eu não deflacionei os dados (hoje é dia de ir ao cinema, né?), mas imagino que a figura geral de estabilização da média do preço não vai mudar muito. Além disso, em uma economia com população em “queda livre”, garantir a audiência do cinema não é algo que se consiga com aumento no preço do ingresso.

Bem, já faz uma hora que estou por aqui e nem sou especialista em mercado cinematográfico. Então, vamos fazer algumas poucas observações finais.

Econometria? Todo cuidado é pouco, e não me refiro à internet ou à TV!

Muito cuidado para não cair na tentação de fazer um diagrama de dispersão entre os ingressos vendidos e o preço médio. Isto não vai te dar uma curva de oferta ou uma curva de demanda. Por que? Porque o número de ingressos vendidos é exatamente o número de ingressos de equilíbrio. Assim, o que temos aí em cima são dados de equilíbrio.

Claro, seria possível tentar obter uma destas curvas indiretamente, usando alguma variável instrumental, mas isto é tema para outro dia.

Conclusão

Ok, eu poderia dizer que os interessados poderiam procurar um pouco de dados de cinema e encontrar alguma coisa para os EUA, mas aí já é ser muito cinéfilo (e eu não sou). Outro tema interessante é verificar a evolução dos filmes japoneses no Brasil. Nos anos 50 (até minha infância cujo período não revelarei…), havia cinemas exclusivos para a colônia lá em São Paulo. Há um bom livro sobre o tema e, bem, talvez eu analise alguns dados daquele livro para ilustrar outro aspecto do R ou da Econometria aqui mas…tudo a seu tempo.

Apêndice – Usando o R

Bom, quanto aos gráficos, vocês notaram que eu mudei o estilo dos mesmos. Usei o R (na verdade, eu praticamente migrei para o RStudio), como sempre. Só para você ter uma idéia dos comandos, eis alguns deles. Os pacotes usados foram lattice latticeExtra. Os dados foram copiados do Excel e colados no RStudio por meio dos seguintes comandos:

base <- read.table(file = “clipboard”, sep = “\t”, header=TRUE)

populacao<-read.table(file=”clipboard”, sep= “\t”, header=TRUE)

Como minha base não estava completa originalmente, você nota que tive que copiar partes da mesma e montá-la em meu ambiente de trabalho (eu tinha os dados de cinema, mas não a população). Segue um exemplo de como converter dados em série de tempo, usando a população.

pop<-ts(populacao,start=(1950),freq=1)
delta_pop<-pop[,2]
delta_male<-pop[,3]
delta_female<-pop[,4]

Para os dados de filmes e ingressos, fiz a mesma coisa:

series <- ts(base, start=c(1955), freq=1)
release_jap<-series[,3]
release_imp<-series[,4]
movie_screens<-series[,2]
total_release<-series[,5]
admissions_thousands<-series[,6]
boxoffice_million_yen<-series[,7]
admission_fee_yen<-series[,8]
jap_distrib_income_million<-series[,9]
non_jap_distrib_income_million<-series[,10]
jap_share<-series[,11]
non_jap_share<-series[,12]

Em seguida, com as bibliotecas citadas, usamos o comando asTheEconomist que gera gráficos como os da revista The Economist (obviamente…). Veja, por exemplo, nosso último gráfico.

asTheEconomist(xyplot(window(admission_fee_yen, start = 1970),
main = “Preço médio do ingresso (Yen)”, sub = “Ano”))

UPDATE

É terrível! Eu abro a caixa de emails e aí encontro uma notícia sobre um dos melhores diretores de cinema japonês…após publicar o post. Bom, já falei dele aqui.

Momento R do Dia: Bitcoins e (uma pretensa introdução superficial a uma conversa posterior sobre) Quebras Estruturais

bitcoin2

O momento R do dia é um pouco mais simples hoje, embora com mais frases. Primeiro, os dados acima são de 2013-01-01 até ontem (sábado) e tive que copiar e colar daqui.

Os dados são diários e, para isso, devemos trabalhar com o pacote zoo. Eis alguns comandos:

library(zoo)

teste <- read.zoo(“bitcoin3.csv”, header=TRUE, sep=”,”, format = “%m/%d/%Y”)

head(teste)

Os comandos acima importam os dados da planilha bitcoin3.csv, ordenados por coluna. Para fazer o gráfico acima, aproveitei-me da simplicidade do pacote lattice.

library(lattice)

xyplot(teste$Weighted_Price)

O gráfico acima, assim, é a série do preço, digamos, médio, do mtgox, a série de bitcoins mais longa que encontrei (embora ela tenha um problema no meio de 2011, motivo pelo qual eu tive que trabalhar com uma série menor (e o gráfico acima é um subconjunto desta série menor). O problema é alguma anomalia que ocorre de 20 a 25 de junho de 2011. Não sei a causa (e agradeço a quem souber).

Eu planejava fazer um post maior, sobre quebras estruturais, mas este gráfico é tão esdrúxulo – começa praticamente estacionário e muda de comportamento – que resolvi deixar esta discussão para depois. O fato é que, fazendo uma rápida análise, não consegui ver alguns fatos destacados por este jornalista.

Há vários testes de quebras estruturais em R e pretendo, ao longo dos próximos meses, usá-los aqui, com vocês. Mas entre minha intenção e a realização da mesma passam muitas quebras estruturais…

p.s. esta conversa toda sobre bitcoins e quebras começou numca conversa com o prof. Diogo Costa que, por algum motivo, ficou curioso sobre este mercado. Um outro aluno, o Jean, também queria discutir este tema. Eu, particularmente, não tenho o menor interesse em bitcoins, exceto como o de uma série adicional para exercícios de Econometria de séries de tempo. Bom, caso eu perceba que vá ganhar dinheiro com isto, aí é que vocês não me ouvirão falar mais disto por um bom tempo. ^_^

p.s.2. Ok, assim que sobrar um tempinho, eu coloco uma análise básica de quebras aqui, só para satisfazer os mais depravados.