Uncategorized

Momento R do Dia – Ainda o aborto na Wikipedia

Lembra do que falei há uns dois ou três posts atrás (na verdade, aqui)? Pois é. Eu estava em busca de um jeito de transformar os dados diários em mensais para ver a sazonalidade das consultas ao verbete “Aborto” citado. Tá, eu sei que talvez esta agregação não seja a melhor, mas, ei, é um exercício de R, né?

Mas, vamos lá: que inferno este negócio de mudar a frequência dos dados, não é não? Não sei você, mas acho isso bem chato. Para minha sorte, veja só, não é que descobri uma função simples e ótima para isto?

Ela está no pacote hydroTSM e se chama daily2monthly. Conferi e funcionou direitinho. Só para você entender, eu havia transferido os dados diários do R para o Excel. Pois, após importá-los para o R novamente, eu apliquei facilmente a função e pedi que a agregação me desse a soma mensal. Fácil.

library(zoo)
base <- read.zoo("C:/Users/cdshi_000/Documents/Meus Documentos/Meus Documentos/aborto1.csv",header=TRUE,sep=",",format = "%m/%d/%Y")
head(base)
summary(base)
plot(base, main="Pageviews do artigo 'Aborto' na Wikipedia em língua portuguesa", ylab="Aborto", xlab="dias")

# Aqui vem a parte legal!
library(hydroTSM)
## Daily to monthly
m <- daily2monthly(base, FUN=sum, na.rm=TRUE)
head(m)
m
plot(m)

# para buscar o padrão sazonal...

library(forecast)
monthplot(m)

Olha aí o dito cujo.
abortosazonal

Interessante, não? Digo, além do fato de termos encontrado um jeito fácil de calcular as somas mensais, ainda conseguimos verificar uma clara mudança no padrão da média mensal das consultas ao verbete “Aborto” da Wikipedia (em língua portuguesa, claro).

Não, não sei se há algum sentido nesta aparente sazonalidade, mas, quem sabe? Comentários são bem-vindos.

Anúncios
Uncategorized

Karl Marx e Adam Smith são como água e óleo? – Momento R do Dia

Será que a busca pelo verbete “Karl Marx” na Wikipedia (em língua inglesa) tem algo a ver com a busca do verbete “Adam Smith” na mesmíssima Wikipedia? Sei lá. Vai que alguém mandou fazer um trabalho de História do Pensamento Econômico…

Pois é. Eu resolvi brincar com os dados e fiz um teste de causalidade (o “água e óleo” do título). As dicas do R aqui são: como importar dados irregulares (usando o pacote zoo) e também como fazer o teste de Granger (há vários jeitos, usei o pacote lmtest).

# Exemplo do marxismo
# Os dados foram baixados da Wikipedia seguindo o exemplo em: 
# http://www.r-datacollection.com/blog/Using-wikipediatrend/
# Depois, levei os dados para o Excel e arrumei a base. 
# Importei as duas séries para o R.

marxism <- read.zoo("C:/Users/cdshi_000/Documents/Meus Documentos/Meus Documentos/smithmarx.csv",header=TRUE,sep=",",format = "%m/%d/%Y")
head(marxism)
summary(marxism)
plot(marxism$Karl_Marx)

# o gráfico acima foi só para checagem.
# Será que há Granger-causalidade?
# Brinquei com vários lags.

library(lmtest)

grangertest(Karl_Marx~Adam_Smith, order=5, data=marxism)
grangertest(Adam_Smith~Karl_Marx, order=5, data=marxism)

grangertest(Karl_Marx~Adam_Smith, order=8, data=marxism)
grangertest(Adam_Smith~Karl_Marx, order=8, data=marxism)

grangertest(Karl_Marx~Adam_Smith, order=10, data=marxism)
grangertest(Adam_Smith~Karl_Marx, order=10, data=marxism)

grangertest(Karl_Marx~Adam_Smith, order=20, data=marxism)
grangertest(Adam_Smith~Karl_Marx, order=20, data=marxism)

Pois é, gente. Eu bem que tentei. Mas, claro, eu fiz isso para a Wikipedia em língua inglesa. Será que os resultados seriam os mesmos na Wikipedia de língua portuguesa? Tenho minhas dúvidas. Claro, faltou um bocado de coisa, mas não estou fazendo nada muito sério.

Repare na entrada dos dados. Na minha planilha, a data tem o formato tal e qual este exemplo: “1/30/2008”. Repare no código, lá no início, como eu digo exatamente isto ao R. Esta é a dica das datas que vale a pena guardar.

Bom, não deu causalidade nas estruturas de defasagem que, arbitrariamente, adotei. Só uma brincadeira, mas divertida. ^_^

Uncategorized

Aborto na Wikipedia (mais um exercício de R com Wikipedia)

aborto

Há um tempo atrás eu coloquei aqui a série de tempo de Aborto no Google Trends. Claro, a pessoa pode procurar “Aborto” na Wikipedia ou no Google por conta de um trabalho escolar e, claro, também pode procurar porque pensa em fazer um aborto.

No caso da Wikipedia, o que é curioso é o período que vai de 2011 a 2012 (não exatamente nos dois anos completos, mas uma simples passada de olhos no gráfico acima é suficiente para você identificar o padrão anômalo ao qual me refiro).

Pensei em pegar os dias do calendário dos anos analisados em que temos feriados (parece que há algo assim aqui), mas acho que é demais para minha pobre alma. Fica para o leitor interessado (e, sim, será um prazer ver o resultado do trabalho…).

O gráfico acima foi obtido a partir do que aprendi aqui. Ah, sim, antes que você me pergunte, o processo acima não tem raiz unitária e um modelo bobo (sim, eu não me preocupei com nada além da brincadeira) que se ajustou aos dados foi um ARIMA(1, 0, 1), mas a previsão, obviamente, não foi lá aquelas coisas.

Entretanto, a gente começa a sonhar, não? Vai que eu pego um verbete mais interessante como “Honda_Civic“) e ajusto um modelo de previsão para a Wikipedia em língua portuguesa? Depois, comparo isto com as buscas no Google ou com sua frequência no Twitter e faço algumas análises.

Hum, é, realmente, Estatística e Econometria não servem para nada, como dizem alguns alunos. Só para dar dor de cabeça para as pessoas.

p.s. Agradeço meu monitor Victor pela conversa de hoje. Os dois últimos parágrafos foram inspirados em nossa breve troca de palavras sobre temas que, ah sim, não servem para nada.

Uncategorized

Karl Marx na Wikipedia…Adam Smith na Wikipedia…(não, não quero “democratizar” nada, é só um exercício do R!)

Em sequência ao texto anterior, mais uma olhadinha para ver quem comanda a desigualdade (parece que precisamos fazer as pessoas lerem mais Adam Smith, né?).

Primeiro, Karl Marx.

marx_tres_linguasAgora, Adam Smith.

smith_treslinguas

Interessante? Dá para brincar mais. Como falei, o texto ultra-didático é este. Parece que acabou a lenda de que existe uma “hegemonia neoliberal” na rede. Os alunos estão lendo pouco Adam Smith em inglês, português ou espanhol, relativamente a Karl Marx.

Fosse eu um destes que quer puxar sardinha, sairia atrás de “quotas de leitura” para o bom escocês, mas não sou desonesto. ^_^

p.s. Sim, tem mais coisas legais para se pensar, mas tá faltando cerveja aqui.

cruzeiro_R

Uncategorized

Duelos do século: Groucho Marx vs Karl Marx e Adam Smith vs Karl Marx

Este tutorial estava tão fácil que tive que replicar. Claro, escolhi dois vocábulos parecidos na Wikipedia: Groucho Marx e Karl Marx. Em seguida, Adam Smith. Ah? O que? Sim, vamos olhar os page views counts para cada uma destas páginas em língua inglesa.

Primeira batalha: Groucho e Karl (em dois horizontes de tempo distintos).

grouchokarl2 grouchokarl1

Vejamos agora a comparação entre Adam Smith e Karl Marx. Vejamos se existe mesmo esta hegemonia “neoliberal” na Wikipedia de língua inglesa.

marx_smith

Parece que a hegemonia não está do lado liberal, heim?

Claro, quero ver com “Ludwig von Mises”, “Friedrich von Hayek”, “Adam Smith” (e quero ver em língua portuguesa, comparativamente com a inglesa….). Talvez alguém queira fazer isso antes de mim e será bem-vindo. Terei prazer em reproduzir os resultados.

p.s. Quer fazer igual? Vai lá ler o link. Afinal, não existe almoço grátis (irônico, não?).