Obviously, educating the people who run the IT environment is the ideal solution, but I’ve never had any success going that route.
A pergunta é: por que será que esta não é a melhor estratégia? Bem, lá no texto dele tem outras dicas, mas eu fico curioso em saber: como é em sua faculdade? Você consegue atualizar o R facilmente? Não? Por que?
Os caçadores de mitos da faculdade me pediram para falar de mais uma cidade. Depois do sucesso que foi o post sobre Campo Belo, um comentarista me pediu a cidade de Conceição do Mato Dentro. Então, vamos lá.
Segundo a Wikipedia, a cidade é uma fonte de histórias interessantes:
As terras do atual município de Conceição do Mato Dentro estiveram ligadas, durante o século XVIII, à antiga Comarca de Sabará e depois à Comarca do Serro Frio.
Depois de descobertas as minas do Serro Frio, a ânsia de novos descobertos levou os sertanistas a novas aventuras. Uma bandeira seguiu para o sul, sendo que Gaspar Ponce de León, Gaspar Soares e Manuel Correia de Paiva chefiavam-na. Descobriram Itapanhoacanga. Lutando contra toda sorte de dificuldades, atravessando montanhas escarpadas, fugindo a encontros com índios, afinal, encontraram ouro em abundância. A eles outros se seguiram, e, em pouco tempo, estava formado o arraial da Conceição.
“Ânsia de novas descobertas” é ótimo. Soa até como uma aventura de sertanistas em busca da fonte da vida eterna. De qualquer forma, antes que alguém me pergunte, não, eu não sei o nome de quem nasce em Itapanhoacanga.
Já meu aluno Zezé é, sem dúvida, um conceicionense, embora eu nunca tenha visto seu passaporte. Em 2010, como se pode ver aqui, havia uma fartura de garotos e garotas na faixa de 15 a 19 anos (respectivamente, 5.5% e 5.0%, o que deve explicar a emigração de Zezé para Belo Horizonte). A população estimada em 2013 era, segundo o IBGE, de 18.273 habitantes.
Então, é isto. Como sabemos, o bom humor move montanhas e os insatisfeitos podem sempre mudar de canal. Nenhum conceicionense foi ferido ou morto durante a confecção deste post e, claro, qualquer semelhança de Zezés com Zezés é mera coincidência.
Cachoeira do Tabuleiro, em formação geológica estimada há aproximadamente 4 bilhões de anos.
Venezuela é um estudo de caso, não? Recentemente (no século passado), um falecido presidente manipulou milhares de dados eleitorais para prejudicar opositores (citei isto aqui dezenas de vezes, mas cito novamente, para quem não tinha conhecimento…aliás, vale a pena acompanhar a página do pesquisador que fez o estudo citado). Mais recentemente ainda, temos um presidente que afirma ter visto o falecido antecessor em um muro do metrô, em um pássaro (verde?), e, sabe-se lá onde mais (não merece um link, merece?). Ouvi-lo é como um pesadelo, como você mesmo pode experimentar.
É um país rico? Bem, basta olhar para as reservas de petróleo do país. Aqueles que não conhecem muito de Economia (e até alguns que conhecem, mas insistem em ignorar os aspectos de Economia Política positiva que se iniciaram há anos pela turma de Public Choice) costumam pensar que reservas de cobre, petróleo ou qualquer outra commodity da moda, é sinônimo de prosperidade. Infelizmente, não é bem assim. Não é porque você tem muitas caixas de fósforos em casa que você fuma, certo? A mesma coisa vale para esta história de petróleo e prosperidade.
Não é preciso ir muito longe. Veja a lista dos países que formam a OPEC (em português: OPEP). Não é exatamente um primor de prosperidade, é? Portanto, sim, é necessário estudar um pouco melhor esta história de instituições que Douglass North, dentre outros trouxe-nos com sua abordagem chamada Nova Economia Institucional.
Entender o retrocesso da Venezuela é uma agenda de pesquisa interessante, mas para quem lá vive, imagino, é um inferno. Um inferno, inclusive, sem papel higiênico, com inflação, violência e um discurso socialista que, sim, incentiva a perpetuação desta situação. Não é uma questão ideológica: o fato de que o sistema socialista tem um desempenho inferior a um sistema de mercado (mesmo que seja o de uma economia mista) não é um wishful thinking. Quer um mundo melhor? Vá estudar economia primeiro, o papel dos incentivos, etc. Não saia por aí batendo em opositores ou quebrando propriedade alheia. Certamente, este não é o caminho.
Mais um exemplo de solução privada para externalidades. Ninguém está dizendo que é sempre assim, mas aquela conversa mole de que o mercado não resolve problemas de externalidades, só o governão, já naufragou há mais tempo que o Titanic…
Há três anos este blog iniciava seus textos com uma bandeira japonesa e uma faixa de luto: havia ocorrido o maior desastre da história moderna japonesa, desde as duas bombas atômicas. Pegos de surpresa, nós, descendentes, assistimos a imagens incríveis e também terríveis na televisão.
Naqueles dias, Belo Horizonte viu o primeiro show da dupla Yayu Fish, promovido por mim e por Gustavo Eda. Um evento que iria ser uma comemoração transformou-se em um misto de alegria e também de apreensão pelo que havia ocorrido lá. Apreensão porque não foi apenas a catástrofe natural. A usina nuclear localizada em Fukushima continua sendo uma fonte de problemas para a sociedade local e o país não pode abrir mão de energia, ainda mais em um momento como este no qual parece haver algum resultado positivo nas políticas econômicas do gabinete do PLD que voltou ao poder após o fracasso do gabinete social-democrata do primeiro-ministro anterior, Naoto Kan.
A infra-estrutura, pode-se dizer, já está bem recuperada e, portanto, talvez agora seja a hora de se analisar a política econômica. A imprensa noticia hoje, de maneira esparsa, o aniversário do acidente (afinal, o dia oficial é amanhã, mas no Japão já estamos no dia 11) e as discussões sobre a Abenomics, neste blog, fazem, portanto, uma pausa breve para um minuto de silêncio para aliviar aqueles que perderam quase tudo e todos naqueles dias.
Pois é. Ordenação de preferências já é um negócio em si. Diz o Estadão:
No grupo Newcomm, as celebridades são tratadas da mesma forma que uma marca de refrigerante ou sabão em pó. O “sobe e desce” da credibilidade de 140 potenciais garotos-propaganda é acompanhado anualmente pelo estudo BAV, feito pela rede, que no Brasil é dona de agências como Young & Rubicam, Grey e Wunderman. A pesquisa, segundo o diretor de inteligência de mercado do Newcomm, César Ortiz, ouviu 3 mil consumidores em seis regiões brasileiras. A ideia, diz ele, é determinar quais “marcas” de celebridades podem dar o maior retorno na hora de vender um produto ou empresa.
Não estamos falando de você, estamos falando de 3 mil consumidores. Bem, é uma amostra razoável (dependendo do que você quer medir, esta é uma amostra razoável sim).
A escolha de um garoto-propaganda, explica Ortiz, considera diversas variáveis. É por isso que as celebridades são analisadas sob os mesmos pontos de vista das marcas de varejo: é preciso entender quais têm mais credibilidade e também quais têm atributos de modernidade. Com base nessas e em outras variáveis, a pesquisa consegue determinar os nomes mais adequados para campanhas institucionais, que ajudam a construir a imagem de uma marca, e quais são bons para transformar produtos em objetos de desejo.
Quais são as dimensões do produto “garoto-propaganda”? Bem, olha aí: alguma coisa chamada “credibilidade” e outra chamada “modernidade”. Obviamente, como profissional de marketing não é bocó, estes conceitos têm uma definição técnica. Afinal, ninguém gasta dinheiro para entrevistar 3 mil pessoas sem pensar no retorno, certo? A matéria tem uma tabela interessante que eu refiz para destacar algumas correlações.
O estudo apresenta duas características: “glamour” e “confiança” que, supostamente, seriam importantes para os consumidores das classes AB e C. Eventualmente, há mulheres famosas que apresentam as duas características para a amostra pesquisada, mas nem todas.
Repare na Fernanda Lima, que inspira glamour para a classe C e confiança para a classe AB, o que a torna um ativo interessante, já que pode fazer campanhas para um consumidor mediano mais representativo da população total (embora com ênfase distinta em cada faixa da população). Outra nesta categoria “universalista” é Ivete Sangalo, inspiradora de glamour para todos e confiança para a classe C.
“- Gente, eu acho que vocês me vêem como uma curva de indiferença…”.
Então, preferências importam. Quando o consumidor assiste a um comercial com a Ivete Sangalo, portanto, ele tenderia a perceber estas duas dimensões: glamour e confiança. Como seria a relação entre estas características para um consumidor? Creio que depende do produto. Digamos, por exemplo, que o produto seja um serviço diferenciado de um banco. Neste caso, para os clientes “vip”, uma Ivete Sangalo na agência bancária seria a garota-propaganda ideal, segundo esta pesquisa. Em outras palavras, eu diria que esta clientela tende a ver glamour e confiança como bens complementares.
É, para mim, a Ivete Sangalo gera um nível de utilidade, para o consumidor mais abastado do banco em uma função com curvas de indiferença do tipo Cobb-Douglas ou Leontief.
Pudesse eu ter acesso às 3 mil observações da amostra e vocês veriam só o que eu iria fazer com o R…
Tomo de empréstimo a base de dados do exercício 19.4 da 5a edição de Gujarati (agora Gujarati & Porter).
Trata-se de um sistema de oferta e demanda de moeda.
Mdt= b0 + b1Yt + b2Rt+b3Pt+u1t
Mst = a0 + a1Yt + u2t
As variáveis R (taxa de juros) e P (índice de preços) são exógenas por hipótese. Percebe-se que existem duas variáveis que não estão na equação de oferta que são, justamente, estas duas. Logo, há duas formas de se identificar a equação de oferta, o que a caracteriza como uma equação sobre-identificada. A equação de demanda, como se vê, é não-identificada (ou sub-identificada).
O exercício de Gujarati pede as formas reduzidas, pergunta sobre identificação e depois faz uma aplicação do teste de simultaneidade e de exogeneidade. Mas nós vamos partir da identificação e usar o pacote systemfit do R para estimar o sistema. Depois, vamos comparar o resultado com aquele obtido por meio do comando ivreg do pacote AER.
Neste pacote – que está bem exemplificado pelos autores do mesmo aqui – a sintaxe dos comandos exige que se escreva o sistema. Assim, temos as seguintes linhas de comando.
Repare que definimos as duas equações e o sistema. Em seguida, informamos ao programa a lista de instrumentos. Para resolver o sistema, usamos o comando systemfit. Note que escolhi o método de Mínimos Quadrados em Dois Estágios (2SLS).
Note que a diferença entre print e summary é de detalhamento. Também note que, com esta biblioteca, o sistema é estimado, mesmo que a equação de demanda não seja identificável. Isto fica claro quando usamos o summary.
The covariance matrix of the residuals demand supply demand 129261.5 58323.1 supply 58323.1 59259.8
The correlations of the residuals demand supply demand 1.000000 0.666386 supply 0.666386 1.000000 2SLS estimates for ‘demand’ (equation 1) Model Formula: m2 ~ gdp + tbrate + cpi Instruments: ~tbrate + cpi
Estimate Std.Error t value Pr(>|t|) (Intercept) -7.95817e+02 2.25516e+09 0 1 gdp 1.65427e-01 8.70873e+05 0 1 tbrate -6.48654e+01 7.93049e+07 0 1 cpi 2.63939e+01 3.61958e+07 0 1
Residual standard error: 359.529607 on 33 degrees of freedom Number of observations: 37 Degrees of Freedom: 33 SSR: 4265630.767425 MSE: 129261.538407 Root MSE: 359.529607 Multiple R-Squared: 0.965079 Adjusted R-Squared: 0.961904 2SLS estimates for ‘supply’ (equation 2) Model Formula: m2 ~ gdp Instruments: ~tbrate + cpi
Residual standard error: 243.433303 on 35 degrees of freedom Number of observations: 37 Degrees of Freedom: 35 SSR: 2074092.061577 MSE: 59259.773188 Root MSE: 243.433303 Multiple R-Squared: 0.98302 Adjusted R-Squared: 0.982535
Repare como os teste “t” e os p-valores da equação estimada de demanda não fazem sentido algum. Agora, vamos fazer o mesmo exercício com o comando ivreg do pacote AER.
Estimação com variáveis instrumentais, por meio do pacote AER
Neste pacote, os comandos são mais intuitivos. Você define uma equação de cada vez. Aproveitei para mostrar o absurdo que é tentar estimar a curva de demanda usando os mesmo instrumentos da oferta. Além disso, para a curva de oferta, apresento os erros-padrão robustos para os estimadores.
> oferta <- ivreg(m2 ~ gdp | tbrate+cpi,) > summary(oferta)
Call: ivreg(formula = m2 ~ gdp | tbrate + cpi)
Residuals: Min 1Q Median 3Q Max -471.89 -123.96 39.56 144.45 434.82
Residual standard error: 243.4 on Inf degrees of freedom Multiple R-Squared: 0.983, Adjusted R-squared: 0.9825 Wald test: 1799 on 1 DF, p-value: < 2.2e-16
> demanda<-ivreg(m2~gdp+tbrate+cpi |tbrate+cpi ) Warning message: In ivreg.fit(X, Y, Z, weights, offset, …) : more regressors than instruments
Percebe-se que os resultados são os mesmos. Quando se pede os diagnósticos, no caso da oferta, temos três testes: Wu-Hausman, Sargan e de exogeneidade fraca. Segundo a documentação:
diagnostics: logical.
Should diagnostic tests for the instrumental-variable regression be carried out? These encompass an F test of the first stage regression for weak instruments, a Wu-Hausman test for endogeneity, and a Sargan test of overidentifying restrictions (only if there are more instruments than regressors).
O teste de Wu-Hausman está resumidamente explicado aqui. Já o teste de Sargan está aqui. Mais detalhes sobre o pacote AER podem ser encontrados aqui. O teste de instrumentos fracos pode ser encontrado em outros lugares, mas o Diffuse Prior tem um interessante texto sobre o tema. Como o teste indica evidências de rejeição da hipótese nula (H0: instrumentos excluídos são irrelevantes), a conclusão, para este exemplo, é a de que os instrumentos não são…irrelevantes, obviamente.
E os outros tópicos do exercício?
Não existe almoço grátis, não é? Portanto, você pode trabalhar sobre estes dados para responder as questões colocadas pelos autores. A bem da verdade, falar sobre a identificação da oferta, da demanda, encontrar as formas reduzidas…isto tudo é muito fácil.
O teste de simultaneidade envolve a estimação da forma reduzida do gdp, obtendo os resíduos e usando-os numa regressão de m2 em gdp e nos resíduos estimados. Na ausência de simultaneidade, os resíduos estimados não deveriam ajudar a explicar m2.
Estou me sentindo generoso hoje. Então, eis os comandos:
Residual standard error: 246.8 on 34 degrees of freedom
Multiple R-squared: 0.983, Adjusted R-squared: 0.982
F-statistic: 985.6 on 2 and 34 DF, p-value: < 2.2e-16
Conclusão
Bem, por hoje é só. Mais um Momento R do Dia que facilita a vida de quem está aprendendo a caminhar no R. Claro, outros exercícios empíricos deveriam ser feitos por você mesmo. Já está aí o caminho das pedras. Faça sua parte.
“Sorte a sua o professor não te passar um sistema de equações simultâneas mais completo, heim?”