Uncategorized

O povo de TI é sempre tão cabeça dura? – Momento R do Dia

O prof. Hyndman tem boas observações sobre esta história de atualizar o R. Um dos trechos:

Obvi­ously, edu­cat­ing the peo­ple who run the IT envi­ron­ment is the ideal solu­tion, but I’ve never had any suc­cess going that route.

A pergunta é: por que será que esta não é a melhor estratégia? Bem, lá no texto dele tem outras dicas, mas eu fico curioso em saber: como é em sua faculdade? Você consegue atualizar o R facilmente? Não? Por que?

Espaço aberto nos comentários.

Uncategorized

Cidades Perdidas – episódio de hoje: Conceição do Mato Dentro

Os caçadores de mitos da faculdade me pediram para falar de mais uma cidade. Depois do sucesso que foi o post sobre Campo Belo, um comentarista me pediu a cidade de Conceição do Mato Dentro. Então, vamos lá.

Eu nunca estive lá, mas…

Dizem tem uma tal de cachoeira do tabuleiro que é a Foz do Iguaçu das Gerais. Honestamente, eu imaginava um tabuleiro de doces de leite em tradicional formato de losangos, mas tudo bem.

Segundo a Wikipedia, a cidade é uma fonte de histórias interessantes:

As terras do atual município de Conceição do Mato Dentro estiveram ligadas, durante o século XVIII, à antiga Comarca de Sabará e depois à Comarca do Serro Frio.

Depois de descobertas as minas do Serro Frio, a ânsia de novos descobertos levou os sertanistas a novas aventuras. Uma bandeira seguiu para o sul, sendo que Gaspar Ponce de LeónGaspar Soares e Manuel Correia de Paiva chefiavam-na. Descobriram Itapanhoacanga. Lutando contra toda sorte de dificuldades, atravessando montanhas escarpadas, fugindo a encontros com índios, afinal, encontraram ouro em abundância. A eles outros se seguiram, e, em pouco tempo, estava formado o arraial da Conceição.

“Ânsia de novas descobertas” é ótimo. Soa até como uma aventura de sertanistas em busca da fonte da vida eterna. De qualquer forma, antes que alguém me pergunte, não, eu não sei o nome de quem nasce em Itapanhoacanga.

Já meu aluno Zezé é, sem dúvida, um conceicionense, embora eu nunca tenha visto seu passaporte. Em 2010, como se pode ver aqui, havia uma fartura de garotos e garotas na faixa de 15 a 19 anos (respectivamente, 5.5% e 5.0%, o que deve explicar a emigração de Zezé para Belo Horizonte). A população estimada em 2013 era, segundo o IBGE, de 18.273 habitantes.

Infelizmente, a prefeitura não disponibilizou aquelas informações de que tantos gostam: bandeira e brasão da cidade…

Então, é isto. Como sabemos, o bom humor move montanhas e os insatisfeitos podem sempre mudar de canal. Nenhum conceicionense foi ferido ou morto durante a confecção deste post e, claro, qualquer semelhança de Zezés com Zezés é mera coincidência.

Cachoeira do Tabuleiro, em formação geológica estimada há aproximadamente 4 bilhões de anos.
Uncategorized

Tanto petróleo…e tanta pobreza

Venezuela é um estudo de caso, não? Recentemente (no século passado), um falecido presidente manipulou milhares de dados eleitorais para prejudicar opositores (citei isto aqui dezenas de vezes, mas cito novamente, para quem não tinha conhecimento…aliás, vale a pena acompanhar a página do pesquisador que fez o estudo citado). Mais recentemente ainda, temos um presidente que afirma ter visto o falecido antecessor em um muro do metrô, em um pássaro (verde?), e, sabe-se lá onde mais (não merece um link, merece?). Ouvi-lo é como um pesadelo, como você mesmo pode experimentar.

É um país rico? Bem, basta olhar para as reservas de petróleo do país. Aqueles que não conhecem muito de Economia (e até alguns que conhecem, mas insistem em ignorar os aspectos de Economia Política positiva que se iniciaram há anos pela turma de Public Choice) costumam pensar que reservas de cobre, petróleo ou qualquer outra commodity da moda, é sinônimo de prosperidade. Infelizmente, não é bem assim. Não é porque você tem muitas caixas de fósforos em casa que você fuma, certo? A mesma coisa vale para esta história de petróleo e prosperidade.

Não é preciso ir muito longe. Veja a lista dos países que formam a OPEC (em português: OPEP). Não é exatamente um primor de prosperidade, é? Portanto, sim, é necessário estudar um pouco melhor esta história de instituições que Douglass North, dentre outros trouxe-nos com sua abordagem chamada Nova Economia Institucional.

Entender o retrocesso da Venezuela é uma agenda de pesquisa interessante, mas para quem lá vive, imagino, é um inferno. Um inferno, inclusive, sem papel higiênico, com inflação, violência e um discurso socialista que, sim, incentiva a perpetuação desta situação. Não é uma questão ideológica: o fato de que o sistema socialista tem um desempenho inferior a um sistema de mercado (mesmo que seja o de uma economia mista) não é um wishful thinking. Quer um mundo melhor? Vá estudar economia primeiro, o papel dos incentivos, etc. Não saia por aí batendo em opositores ou quebrando propriedade alheia. Certamente, este não é o caminho.

Uncategorized

Grande Tsunami: agora, já três anos

nihonhata Há três anos este blog iniciava seus textos com uma bandeira japonesa e uma faixa de luto: havia ocorrido o maior desastre da história moderna japonesa, desde as duas bombas atômicas. Pegos de surpresa, nós, descendentes, assistimos a imagens incríveis e também terríveis na televisão.

Naqueles dias, Belo Horizonte viu o primeiro show da dupla Yayu Fish, promovido por mim e por Gustavo Eda. Um evento que iria ser uma comemoração transformou-se em um misto de alegria e também de apreensão pelo que havia ocorrido lá. Apreensão porque não foi apenas a catástrofe natural. A usina nuclear localizada em Fukushima continua sendo uma fonte de problemas para a sociedade local e o país não pode abrir mão de energia, ainda mais em um momento como este no qual parece haver algum resultado positivo nas políticas econômicas do gabinete do PLD que voltou ao poder após o fracasso do gabinete social-democrata do primeiro-ministro anterior, Naoto Kan.

A infra-estrutura, pode-se dizer, já está bem recuperada e, portanto, talvez agora seja a hora de se analisar a política econômica. A imprensa noticia hoje, de maneira esparsa, o aniversário do acidente (afinal, o dia oficial é amanhã, mas no Japão já estamos no dia 11) e as discussões sobre a Abenomics, neste blog, fazem, portanto, uma pausa breve para um minuto de silêncio para aliviar aqueles que perderam quase tudo e todos naqueles dias.

Voltamos logo mais. Até lá, força, Touhoku!

Uncategorized

Preferências do consumidor importam? Pergunte à Ivete Sangalo, Fernanda Lima ou à Regina Casé!

Pois é. Ordenação de preferências já é um negócio em si. Diz o Estadão:

No grupo Newcomm, as celebridades são tratadas da mesma forma que uma marca de refrigerante ou sabão em pó. O “sobe e desce” da credibilidade de 140 potenciais garotos-propaganda é acompanhado anualmente pelo estudo BAV, feito pela rede, que no Brasil é dona de agências como Young & Rubicam, Grey e Wunderman. A pesquisa, segundo o diretor de inteligência de mercado do Newcomm, César Ortiz, ouviu 3 mil consumidores em seis regiões brasileiras. A ideia, diz ele, é determinar quais “marcas” de celebridades podem dar o maior retorno na hora de vender um produto ou empresa.

Não estamos falando de você, estamos falando de 3 mil consumidores. Bem, é uma amostra razoável (dependendo do que você quer medir, esta é uma amostra razoável sim).

A escolha de um garoto-propaganda, explica Ortiz, considera diversas variáveis. É por isso que as celebridades são analisadas sob os mesmos pontos de vista das marcas de varejo: é preciso entender quais têm mais credibilidade e também quais têm atributos de modernidade. Com base nessas e em outras variáveis, a pesquisa consegue determinar os nomes mais adequados para campanhas institucionais, que ajudam a construir a imagem de uma marca, e quais são bons para transformar produtos em objetos de desejo.

Quais são as dimensões do produto “garoto-propaganda”? Bem, olha aí: alguma coisa chamada “credibilidade” e outra chamada “modernidade”. Obviamente, como profissional de marketing não é bocó, estes conceitos têm uma definição técnica. Afinal, ninguém gasta dinheiro para entrevistar 3 mil pessoas sem pensar no retorno, certo? A matéria tem uma tabela interessante que eu refiz para destacar algumas correlações.

estadao_glamour2

O estudo apresenta duas características: “glamour” e “confiança” que, supostamente, seriam importantes para os consumidores das classes AB e C. Eventualmente, há mulheres famosas que apresentam as duas características para a amostra pesquisada, mas nem todas.

Repare na Fernanda Lima, que inspira glamour para a classe C e confiança para a classe AB, o que a torna um ativo interessante, já que pode fazer campanhas para um consumidor mediano mais representativo da população total (embora com ênfase distinta em cada faixa da população). Outra nesta categoria “universalista” é Ivete Sangalo, inspiradora de glamour para todos e confiança para a classe C.

“- Gente, eu acho que vocês me vêem como uma curva de indiferença…”.

Então, preferências importam. Quando o consumidor assiste a um comercial com a Ivete Sangalo, portanto, ele tenderia a perceber estas duas dimensões: glamour e confiança. Como seria a relação entre estas características para um consumidor? Creio que depende do produto. Digamos, por exemplo, que o produto seja um serviço diferenciado de um banco. Neste caso, para os clientes “vip”, uma Ivete Sangalo na agência bancária seria a garota-propaganda ideal, segundo esta pesquisa. Em outras palavras, eu diria que esta clientela tende a ver glamour e confiança como bens complementares.

É, para mim, a Ivete Sangalo gera um nível de utilidade, para o consumidor mais abastado do banco em uma função com curvas de indiferença do tipo Cobb-Douglas ou Leontief.

Pudesse eu ter acesso às 3 mil observações da amostra e vocês veriam só o que eu iria fazer com o R…

Uncategorized

Exemplo de 2SLS em R (Momento R do Dia)

Tomo de empréstimo a base de dados do exercício 19.4 da 5a edição de Gujarati (agora Gujarati & Porter).

Trata-se de um sistema de oferta e demanda de moeda.

Mdt= b0 + b1Yt + b2Rt+b3Pt+u1t

Mst = a0 + a1Yt + u2t

As variáveis R (taxa de juros) e P (índice de preços) são exógenas por hipótese. Percebe-se que existem duas variáveis que não estão na equação de oferta que são, justamente, estas duas. Logo, há duas formas de se identificar a equação de oferta, o que a caracteriza como uma equação sobre-identificada. A equação de demanda, como se vê, é não-identificada (ou sub-identificada).

O exercício de Gujarati pede as formas reduzidas, pergunta sobre identificação e depois faz uma aplicação do teste de simultaneidade e de exogeneidade. Mas nós vamos partir da identificação e usar o pacote systemfit do R para estimar o sistema. Depois, vamos comparar o resultado com aquele obtido por meio do comando ivreg do pacote AER.

Para importar os dados, fazemos:

# importar Table 19.4.xls

base <- read.table(file = "clipboard", sep = "\t", header=TRUE)
head(base)
m2<-ts(base$M2, start=c(1970),freq=1)
gdp<-ts(base$GDP, start=c(1970),freq=1)
tbrate<-ts(base$TBRATE, start=c(1970),freq=1)
cpi<-ts(base$CPI, start=c(1970),freq=1)

Feito isto, vamos aos dois métodos de estimação.

Estimando o sistema com “systemfit”

Neste pacote – que está bem exemplificado pelos autores do mesmo aqui – a sintaxe dos comandos exige que se escreva o sistema. Assim, temos as seguintes linhas de comando.

library(systemfit)
demand1<-m2~gdp+tbrate+cpi
supply1<-m2~gdp
system<-list(demand=demand1,supply=supply1)
inst1<-~tbrate+cpi

Repare que definimos as duas equações e o sistema. Em seguida, informamos ao programa a lista de instrumentos. Para resolver o sistema, usamos o comando systemfit. Note que escolhi o método de Mínimos Quadrados em Dois Estágios (2SLS).

fit2sls2<-systemfit(system,"2SLS",inst=inst1)
print(fit2sls2)
summary(fit2sls2)

Note que a diferença entre print e summary é de detalhamento. Também note que, com esta biblioteca, o sistema é estimado, mesmo que a equação de demanda não seja identificável. Isto fica claro quando usamos o summary.

> print(fit2sls2)

systemfit results
method: 2SLS

Coefficients:
demand_(Intercept)        demand_gdp        demand_tbrate     demand_cpi
-795.817242                      0.165427             -64.865418         26.393878
supply_(Intercept)      supply_gdp
-2517.944548             0.805575
> summary(fit2sls2)

systemfit results
method: 2SLS

              N  DF     SSR      detRCov         OLS-R2   McElroy-R2
system 74 68  6339723   4258428053   0.974049     0.967006

                N DF SSR MSE RMSE R2 Adj R2
demand 37 33 4265631 129261.5 359.530 0.965079 0.961904
supply 37 35 2074092 59259.8 243.433 0.983020 0.982535

The covariance matrix of the residuals
demand supply
demand 129261.5 58323.1
supply 58323.1 59259.8

The correlations of the residuals
demand supply
demand 1.000000 0.666386
supply 0.666386 1.000000
2SLS estimates for ‘demand’ (equation 1)
Model Formula: m2 ~ gdp + tbrate + cpi
Instruments: ~tbrate + cpi

                    Estimate          Std.Error         t value    Pr(>|t|)
(Intercept)     -7.95817e+02    2.25516e+09    0          1
gdp                1.65427e-01      8.70873e+05    0          1
tbrate             -6.48654e+01    7.93049e+07    0         1
cpi                 2.63939e+01      3.61958e+07    0          1

Residual standard error: 359.529607 on 33 degrees of freedom
Number of observations: 37 Degrees of Freedom: 33
SSR: 4265630.767425 MSE: 129261.538407 Root MSE: 359.529607
Multiple R-Squared: 0.965079 Adjusted R-Squared: 0.961904
2SLS estimates for ‘supply’ (equation 2)
Model Formula: m2 ~ gdp
Instruments: ~tbrate + cpi

                            Estimate      Std. Error             t value      Pr(>|t|)
(Intercept)        -2.51794e+03  1.32467e+02    -19.0081   < 2.22e-16 ***
gdp                    8.05575e-01  1.81658e-02       44.3456   < 2.22e-16 ***

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 243.433303 on 35 degrees of freedom
Number of observations: 37 Degrees of Freedom: 35
SSR: 2074092.061577 MSE: 59259.773188 Root MSE: 243.433303
Multiple R-Squared: 0.98302 Adjusted R-Squared: 0.982535

Repare como os teste “t” e os p-valores da equação estimada de demanda não fazem sentido algum. Agora, vamos fazer o mesmo exercício com o comando ivreg do pacote AER.

Estimação com variáveis instrumentais, por meio do pacote AER

Bem, aqui vão os comandos.

library(AER)
oferta <- ivreg(m2 ~ gdp | tbrate+cpi,)
summary(oferta)
summary(oferta, vcov = sandwich, df = Inf, diagnostics = TRUE)
demanda<-ivreg(m2~gdp+tbrate+cpi |tbrate+cpi )

Neste pacote, os comandos são mais intuitivos. Você define uma equação de cada vez. Aproveitei para mostrar o absurdo que é tentar estimar a curva de demanda usando os mesmo instrumentos da oferta. Além disso, para a curva de oferta, apresento os erros-padrão robustos para os estimadores.

> oferta <- ivreg(m2 ~ gdp | tbrate+cpi,)
> summary(oferta)

Call:
ivreg(formula = m2 ~ gdp | tbrate + cpi)

Residuals:
Min 1Q Median 3Q Max
-471.89 -123.96 39.56 144.45 434.82

Coefficients:
                     Estimate     Std. Error     t value    Pr(>|t|)
(Intercept)    -2.518e+03   1.325e+02   -19.01 <2e-16 ***
gdp                8.056e-01    1.817e-02     44.35 <2e-16 ***

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 243.4 on 35 degrees of freedom
Multiple R-Squared: 0.983, Adjusted R-squared: 0.9825
Wald test: 1967 on 1 and 35 DF, p-value: < 2.2e-16

> summary(oferta, vcov = sandwich, df = Inf, diagnostics = TRUE)

Call:
ivreg(formula = m2 ~ gdp | tbrate + cpi)

Residuals:
Min 1Q Median 3Q Max
-471.89 -123.96 39.56 144.45 434.82

Coefficients:
                       Estimate        Std. Error   z value  Pr(>|z|)
(Intercept)        -2.518e+03   1.066e+02   -23.61  <2e-16 ***
gdp                    8.056e-01   1.899e-02     42.41  <2e-16 ***

Diagnostic tests:
                                      df1 df2 statistic p-value
Weak instruments        2   34   575.139 <2e-16 ***
Wu-Hausman               1   34      0.047    0.829
Sargan                          1   NA     0.166    0.684

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 243.4 on Inf degrees of freedom
Multiple R-Squared: 0.983, Adjusted R-squared: 0.9825
Wald test: 1799 on 1 DF, p-value: < 2.2e-16

> demanda<-ivreg(m2~gdp+tbrate+cpi |tbrate+cpi )
Warning message:
In ivreg.fit(X, Y, Z, weights, offset, …) :
more regressors than instruments

Percebe-se que os resultados são os mesmos. Quando se pede os diagnósticos, no caso da oferta, temos três testes: Wu-Hausman, Sargan e de exogeneidade fraca. Segundo a documentação:

diagnostics:  logical.

Should diagnostic tests for the instrumental-variable regression be carried out? These encompass an F test of the first stage regression for weak instruments, a Wu-Hausman test for endogeneity, and a Sargan test of overidentifying restrictions (only if there are more instruments than regressors).

O teste de Wu-Hausman está resumidamente explicado aqui. Já o teste de Sargan está aqui. Mais detalhes sobre o pacote AER podem ser encontrados aqui. O teste de instrumentos fracos pode ser encontrado em outros lugares, mas o Diffuse Prior tem um interessante texto sobre o tema. Como o teste indica evidências de rejeição da hipótese nula (H0: instrumentos excluídos são irrelevantes), a conclusão, para este exemplo, é a de que os instrumentos não são…irrelevantes, obviamente.

E os outros tópicos do exercício?

Não existe almoço grátis, não é? Portanto, você pode trabalhar sobre estes dados para responder as questões colocadas pelos autores. A bem da verdade, falar sobre a identificação da oferta, da demanda, encontrar as formas reduzidas…isto tudo é muito fácil.

O teste de simultaneidade envolve a estimação da forma reduzida do gdp, obtendo os resíduos e usando-os numa regressão de m2 em gdp e nos resíduos estimados. Na ausência de simultaneidade, os resíduos estimados não deveriam ajudar a explicar m2.

Estou me sentindo generoso hoje. Então, eis os comandos:

simult.test&lt;-lm(gdp~tbrate+cpi)
summary(simult.test)
vchapeu&lt;-simult.test$resid
simult.test2&lt;-lm(m2~gdp+vchapeu)
summary(simult.test2)

Coefficients:

Estimate    Std. Error   t value   Pr(>|t|)
(Intercept)           -2.518e+03  1.343e+02   -18.748   <2e-16 ***
gdp                       8.056e-01   1.842e-02   43.738   <2e-16 ***
vchapeu              -2.237e-02   1.043e-01   -0.214    0.832

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 246.8 on 34 degrees of freedom
Multiple R-squared: 0.983, Adjusted R-squared: 0.982
F-statistic: 985.6 on 2 and 34 DF, p-value: < 2.2e-16

Conclusão

Bem, por hoje é só. Mais um Momento R do Dia que facilita a vida de quem está aprendendo a caminhar no R. Claro, outros exercícios empíricos deveriam ser feitos por você mesmo. Já está aí o caminho das pedras. Faça sua parte.

2014-02-21 21.26.01
“Sorte a sua o professor não te passar um sistema de equações simultâneas mais completo, heim?”