Uncategorized

Para a galera da 109!

Então pessoal, o R nos deixou. Por mais triste que isso pareça ser, não há motivos para pânico. O Stata é muito bom. O problema é que é pago e a licença não é das mais baratas, mas enfim, essa é a vida.

Segue abaixo os comando necessários para resolver o exercício empírico 10.2 do livro Introduction to Econometrics 3rd Edition, Stock and Watson. A ideia inicial era fazer algo mais completo, mas como meu tempo está curto vou colocar só os comandos e as saídas. A ideia é facilitar a vida de quem quer estudar e não entregar tudo de mão beijada. Sou aluno da matéria também, aprendo fazendo isso e a intenção principal é essa, então, a probabilidade de surgirem outros posts como esse é alta.

Os dois últimos itens do exercício vou ficar devendo. São quase 21:00 de uma quinta feira e estou na faculdade ainda, trabalhei a tarde inteira e estou um pouco cansado. Queria estar com a minha namorada agora, mas como não tenho uma, fico com a econometria mesmo.

Vamos lá!

Os acidentes automobilísticos são os principais causadores de mortes entre os americanos com idade entre 5 e 32 anos. Através de alguns incentivos políticos, o governo federal tem encorajado os estados a criarem uma lei que torne o uso do cinto de segurança obrigatório. Neste exercício iremos analisar o quão eficientes essas leis têm sido em aumentar o uso do cinto e diminuir o número de fatalidades. No site do livro http://www.pearsonhighered.com/stock_watson você encontrará o link da base de dados Seatbelts que contem os dados em painel de 50 estados mais o distrito de Columbia para os anos de 1983 até 1997.

1) Estime o efeito do uso do cinto de segurança na taxa de fatalidade regredindo FatalityRate em sb_useage, speed65, speed70, ba08, drinkage21, ln(income) e age. O resultado da estimação nos sugere que o uso do cinto de segurança reduz o número de fatalidades?

Vou colocar um “.” na frente dos comando para melhorar a visualização.

. encode state, gen(state1)
. xtset state1 year
. gen lnincome=ln(income)
. regress fatalityrate sb_useage speed65 speed70 ba08 drinkage21 lnincome age



Source |       SS       df       MS              Number of obs =     556
-------------+------------------------------           F(  7,   548) =   95.41
       Model |  .007711649     7  .001101664           Prob > F      =  0.0000
    Residual |  .006327757   548  .000011547           R-squared     =  0.5493
-------------+------------------------------           Adj R-squared =  0.5435
       Total |  .014039406   555  .000025296           Root MSE      =   .0034

------------------------------------------------------------------------------
fatalityrate |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
   sb_useage |   .0040684   .0012158     3.35   0.001     .0016803    .0064565
     speed65 |   .0001479   .0004029     0.37   0.714    -.0006436    .0009394
     speed70 |   .0024045   .0005112     4.70   0.000     .0014003    .0034086
        ba08 |  -.0019246   .0004447    -4.33   0.000    -.0027982    -.001051
  drinkage21 |   .0000799   .0008756     0.09   0.927    -.0016401    .0017998
    lnincome |  -.0181444   .0009311   -19.49   0.000    -.0199733   -.0163155
         age |  -7.22e-06   .0001089    -0.07   0.947    -.0002212    .0002067
       _cons |   .1965469   .0082232    23.90   0.000     .1803941    .2126998
------------------------------------------------------------------------------

2) Os resultados mudam quando se usa efeito fixo? Tente explicar de forma intuitiva porque os resultados mudam. (Lembre-se do viés de variável omitda..)

. xtreg fatalityrate sb_useage speed65 speed70 ba08 drinkage21 lnincome age, fe vce(cluster state1)

Fixed-effects (within) regression               Number of obs      =       556
Group variable: state1                          Number of groups   =        51

R-sq:  within  = 0.6868                         Obs per group: min =         8
       between = 0.1957                                        avg =      10.9
       overall = 0.3896                                        max =        15

                                                F(7,50)            =     96.72
corr(u_i, Xb)  = -0.1332                        Prob > F           =    0.0000

                                (Std. Err. adjusted for 51 clusters in state1)
------------------------------------------------------------------------------
             |               Robust
fatalityrate |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
   sb_useage |  -.0057748   .0016693    -3.46   0.001    -.0091276    -.002422
     speed65 |   -.000425   .0004555    -0.93   0.355    -.0013399    .0004898
     speed70 |   .0012333   .0003483     3.54   0.001     .0005337    .0019329
        ba08 |  -.0013775   .0003751    -3.67   0.001    -.0021308   -.0006241
  drinkage21 |   .0007453   .0007184     1.04   0.305    -.0006976    .0021883
    lnincome |  -.0135144   .0023849    -5.67   0.000    -.0183047   -.0087241
         age |   .0009787   .0007461     1.31   0.196    -.0005199    .0024772
       _cons |   .1209958   .0184235     6.57   0.000     .0839912    .1580005
-------------+----------------------------------------------------------------
     sigma_u |  .00383103
     sigma_e |   .0017871
         rho |  .82128567   (fraction of variance due to u_i)
------------------------------------------------------------------------------

3) Os resultados mudam quando se usa efeito fixo no estado e no tempo?

. areg fatalityrate sb_useage speed65 speed70 ba08 drinkage21 lnincome age, absorb(state1) vce(cluster state1)

Linear regression, absorbing indicators           Number of obs   =        556
                                                  F(   7,     50) =      87.90
                                                  Prob > F        =     0.0000
                                                  R-squared       =     0.8867
                                                  Adj R-squared   =     0.8737
                                                  Root MSE        =     0.0018

                                (Std. Err. adjusted for 51 clusters in state1)
------------------------------------------------------------------------------
             |               Robust
fatalityrate |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
   sb_useage |  -.0057748    .001751    -3.30   0.002    -.0092919   -.0022577
     speed65 |   -.000425   .0004778    -0.89   0.378    -.0013847    .0005346
     speed70 |   .0012333   .0003654     3.38   0.001     .0004994    .0019671
        ba08 |  -.0013775   .0003935    -3.50   0.001    -.0021677   -.0005872
  drinkage21 |   .0007453   .0007536     0.99   0.327    -.0007684     .002259
    lnincome |  -.0135144   .0025018    -5.40   0.000    -.0185394   -.0084894
         age |   .0009787   .0007826     1.25   0.217    -.0005933    .0025507
       _cons |   .1209958   .0193262     6.26   0.000      .082178    .1598137
-------------+----------------------------------------------------------------
      state1 |   absorbed                                      (51 categories)

4) Qual das especificações usadas até o momento se aproximam mais da realidade? Por quê?

Pense que o uso de efeitos fixos, tanto no tempo quanto nos estados, nos ajudam a medir variáveis que não são observáveis, mas caso sejam omitidas, geram viés em nossa análise e jogam o trampo todo no lixo. O habito dos habitantes de cada estado em relação ao uso do cinto de segurança pode ser uma variável fixa no tempo, mas não entre os estados enquanto uma lei federal que obrigue todos os estados a fiscalizar o uso de cinto de segurança pode ser uma variável que varia no tempo, mas não entre os estados. Logo, por levar em consideração o efeito de variáveis não observáveis, o terceiro modelo se aproxima mais da realidade.

Todo mundo usando cinto!
Todo mundo usando cinto!

5) Usando os resultados obtidos na questão 3, analise o valor do coeficiente de sb_useage. É grande? Pequeno? Quantas vidas seriam salvas se a taxa do uso de cinto de segurança subisse de 52% para 90%?

Para responder a pergunta é necessário entrar em alguns detalhes à respeito da base de dados. Esses “detalhes” você encontra no link Seatbelts_Description, no site do livro que está no enunciado da questão.

Bom pessoal, espero ter ajudado. Mesmo.

Gostei do Stata. No R, como há maior “liberdade” para trabalhar e criar, as coisas acabam sendo mais intuitivas, o que facilita um pouco. Andei olhando alguns fóruns na internet e pude perceber que o Stata está presenta em muitas universidades dos EUA e da Europa, então, é um privilégio também ter acesso a essa ferramenta. Até agora vimos o Eviews na Econometria 1, o R na Econometria 2 e o Stata na Econometria 3, o que é muito bom.

Enfim, é isso ai pessoal. Um abraço.

Uncategorized

Em tempos de ignorância, uma brisa de sobriedade não faz mal a ninguém.

Primeiro, a ignorância:

Agora, a brisa de sobriedade:

Sem título

Entra eleição, sai eleição e eles sempre estão lá. Parece piada, mas não é. Ainda existem pessoas que caem nesse tipo de conversa e defendem veemente a luta contra “o capital”. Justo ele que emprega, gera renda, movimenta a economia e ainda financia “o estado”. Só o que a Vale já pagou de impostos ao governo brasileiro supera, e muito, todo o faturamento que um dia ela já teve sendo uma estatal.

Não precisa ser um apaixonado pela iniciativa privada, mas dizer que ela faz mal tende ao absurdo. Nem mesmo o estado acredita nisso, afinal, o que seria dele se não fossem as empresas? Seria ele capaz de criar o mesmo número de emprego e gerar o mesmo nível de renda? Seria ele capaz de desenvolver os mesmos remédios, as mesmas pesquisas, os mesmos avanços? Não e, mais uma vez, nem mesmo ele acredita nisso.

Bom, passado esse momento de sobriedade vamos a algumas breves explicações à respeito do meu desaparecimento. Não imaginei que trabalhar fosse tomar tanto o meu tempo e tanto a minha cabeça e, para piorar a situação, deixei para tirar carteira de motorista só agora e estava no limite do cansaço e da pressão para resolver isso logo. Graças a Deus deu tudo certo e as coisas estão voltando ao normal. Agora é colocar a vida em ordem e isso inclui voltar a publicar mais aqui.

Então é isso. Quando ver o vídeo acima e pensar que não há motivos para ter esperança, olhe para o gráfico de dispersão logo abaixo e lembre que ainda há motivos para sorrir.

Uncategorized

O IPCA da Copa

O IPCA tem sido o centro das atenções nos últimos meses. Em patamares altos, coloca em risco, a já ruim, popularidade de Dilma e nos faz questionar a respeito dos coelhos que a presidente e sua equipe pretendem tirar da cartola para reverter a situação, dado que estamos em ano eleitoral.

É muito comum observar governos adotarem medidas de curto prazo em ano de eleição, como um ultimo suspiro antes da sociedade revelar sua preferência por um ou outro governante nas urnas. Mas Dilma tem um problema pela frente. O Brasil não tem mais pulmão para acompanhar o ritmo de suas medidas econômicas e o que poderia ser feito para ajudar, do ponto de vista político, pode atrapalhar e muito.

Depois de ter gastado algumas boas horas criando e testando modelos de previsão de IPCA, cheguei a um SARIMA que, em meio a suas limitações, é coerente e nos ajuda a imaginar um pouco o que está por vir. Vale lembrar que um SARIMA tem um intervalo de confiança generoso, para não dizer outra coisa, e como a previsão foi feita para os próximos nove meses a tendência é que os intervalos fiquem cada vez maiores. Paciência.

Por razões lógicas, não irei divulgar o meu modelo aqui, mas nada melhor do que um belo correlograma para nos dizer um pouco à respeito da coerência de um SARIMA. Segue abaixo:

resisarimaipca

Fiquem à vontade para dar a opinião de vocês. Considero razoável a hipótese de que o modelo é, no mínimo, interessante.

Segue agora o correlograma da série. Os dados são desde janeiro de 1999.

Rplot

Essa é a hora de deixar a imaginação falar. É claro que sem ter estudado um pouco da metodologia Box-Jenkins fica difícil propor um modelo, mas depois de ler um pouco e fazer alguns exercícios, ou vários, as coisas começam a ficar mais claras.

Agora, o ajuste do SARIMA à série original:

Rplot01

Em preto, a série original, em vermelho, o ajuste do modelo. Passível de críticas, lógico. Aceito as que sejam construtivas nos comentários.

Após essa breve introdução, vamos fazer as previsões e observar o que o modelo nos diz à respeito do futuro. Segue as previsões para os próximos nove meses:

Point Forecast        Lo 80     Hi 80       Lo 95    Hi 95

Apr 2014      0.9042943  0.547518540 1.2610700  0.35865288 1.449936

May 2014      0.7342194  0.296905829 1.1715331  0.06540599 1.403033

Jun 2014      0.4632798  0.001661066 0.9248985 -0.24270511 1.169265

Jul 2014      0.4109195 -0.061853178 0.8836923 -0.31212394 1.133963

Aug 2014      0.5092334  0.031540558 0.9869262 -0.22133474 1.239801

Sep 2014      0.5648867  0.084299595 1.0454738 -0.17010786 1.299881

Oct 2014      0.4922249  0.010919725 0.9735300 -0.24386783 1.228318

Nov 2014      0.4882966  0.006923685 0.9696696 -0.24789976 1.224493

Dec 2014      0.6616659  0.180124356 1.1432075 -0.07478836 1.398120

previanual

Como podemos observar através dos resultados, previsão de inflação acima do centro da meta para o resto do ano. Inflação no centro da meta não é pauta mais, nem no discurso do ministro Mantega e muito menos no que tem se observado até aqui. Assim como as Contas Nacionais, o IPCA também passou um processo de margarinarização (entendedores entenderão) e a meta agora é o limite superior, o centro da meta é somente uma abstração neoliberal.

Confesso que IPCA não é o meu forte, por isso, vou encerrar minha análise por aqui. Na previsão, o acumulado do ano está em 7.38, 0.88 acima do limite superior da meta. Ao longo do ano eu venho ao blog e atualizo as previsões, é claro que o modelo vai errar algumas vezes e, espero eu, acertar em outras. A base de dados vai mudando e as previsões também, normal.

Triste ver a década de 80 virando a esquina e nos assombrando novamente, mas uma hora essa conta ia chegar. Por mais engraçado que isso possa soar, tomara que eu esteja errado.

 

Uncategorized

PT até quando?

Como deixa claro o dito popular, “errar é humano, permanecer no erro é ignorância”. Há mais de uma década no poder o PT está mal, e pior, está mal e recusa-se a assumir seus erros. As medidas econômicas de crescimento a curto prazo já não funcionam mais, a conta bate à porta e o investimento, que nunca foi de dar muito as caras, permanece quieto, calado e mudo. Problemas hoje, problemas para o amanhã.

Em um ambiente macroeconômico as expectativas dos agentes têm vital importância. Têm o poder de trazer o longo prazo para o presente e, dependendo da situação, adiantando problemas. Como é o caso da inflação. Expectativa de inflação para o futuro aumenta a demanda por moeda hoje. Logo, inflação hoje. Dado que uma das funções da moeda é ser reserva de valor, se creio que no futuro parte do seu valor será corroído, transaciono hoje, demando moeda hoje. Sendo assim, conter as expectativas é de suma importância para manter estabilidade na economia.

Uma alternativa de manter as expectativas sob controle é contando algumas mentiras. Você pode dizer que está tudo bem enquanto está tudo mal. Se você tiver um background interessante, como Dilma tem o de Lula, afinal, agora as pessoas podem ter geladeira e televisão de plasma, a mentira pode até funcionar. O problema é que a natureza econômica não acredita em mentiras, ela respeita as premissas básicas da economia de que não há almoço grátis, de que é necessário haver poupança para que ocorra investimento e que um Banco Central com credibilidade é o mínimo para se pensar em estabilidade da moeda, entre outros.

Hoje a verdade bate à porta e as mentiras, assim como as burras políticas econômicas, não estão funcionando mais. IPCA de 0.92 no mês, escândalos da Petrobras e aumento dos impostos para financiar dívida de um governo que não reconhece que errou e teima em continuar errando. Não reconhece porque tem medo. Tem medo de o teatro acabar, medo das pessoas descobrirem que existe algo de errado nesse discurso demagógico de “povo” e de “estado”.

O que se observa entre os governos de esquerda a redor do mundo é a insistência em querer vender “O Estado”, uma maquina de benevolência, pronta para gastar e alimentar os famintos. Mentira, balela. E pior, além de vender a idéia errada de um suposto “Estado Ideal”, ataca o privado através de um discurso fundamentado no materialismo histórico de Marx, onde os meios de produção definem as classes em um sistema econômico injusto e desigual. Hoje, no Brasil, um empresário ao contratar o trabalhador mediano brasileiro, sem instrução alguma para atender as demandas básicas que sua função exige, pratica caridade e não injustiça. Ao vender a Idéia de um estado bonzinho e de um privado malvado, cria-se por meio de um governo autoritário uma classe muito mais opressora e ineficiente, O Governo. A incoerência reina, mas detendo eles o monopólio das virtudes, uma argumentação inteligente e fundamentada em teoria política e econômica vira agressão, ataque.

“Ataque político” é como Dilma descreve as criticas à gestão da Petrobras. Mesmo tendo perdido mais da metade de seu valor de mercado nos últimos dois anos, mesmo com as polêmicas em volta da compra da refinaria em Pasadena, mesmo sendo uma das empresas mais endividadas do mundo, a presidente do país tem a coragem de ir a público e dizer que estão tentando acabar com a imagem de uma empresa que “o povo tanto lutou para construir”. Mais uma vez, valendo-se do “povo” para justificar os seus erros de seu governo. Bem sabe ela que a Petrobras foi fundada por um ditador, fascista, que deu um monte de pão e circo para o povo acreditar nas suas boas intenções. Algo bem parecido com o que ela faz hoje. Petrobras não tem nada de “povo”.

Confesso que tenho medo de onde isso pode parar, caso as eleições de outubro coroem a incompetência desse partido populista mentiroso. Um partido com líderes que não reconhecem os seus erros, um partido que tem mobilizado a máquina pública em favor de seus interesses, que tem colocado em risco a saúde financeira do Brasil. Um dos cases de corrupção com a maior condescendência pública da história, dando sequencia ao estereótipo criado por José Murilo de Carvalho em “Os Bestializados”. Bestializado, o “povo” assiste de camarote os absurdos de Dilma e sua trupe em nome de suas ideologias ultrapassadas e mentirosas.

Conter expectativas com mentiras tem sido o carro chefe do PT nos últimos doze anos de seu governo e como favas contadas, o discurso seguirá adiante. E assim o será porque é desta forma que eles sabem fazer política. Cabe a nós tirá-los de lá.

dilma-rindo

Uncategorized

Para a galera da 112! – A série do IPCA

Ola, pessoal!

Este é o meu primeiro post aqui no Gustibus. Desvinculei-me formalmente do NEPOM na semana passada e a partir de agora vou postar somente nesta plataforma. Graças ao NEPOM, hoje faço parte de uma grande instituição financeira. Minha eterna gratidão a toda equipe. Infelizmente o tempo vai ficar curto e integrar o NEPOM como um membro tornou-se impraticável.

Aliás, tem o meu texto de despedida, uma breve análise que o professor Ari me pediu na última reunião. Ficará para depois da minha semana de provas.

Esse post é o resultado da ultima aula de Econometria II do IBMEC MG, matéria ministrada pelo professor Claudio Shikida.

Para o leitor que não é aluno da matéria, na ultima aula trabalhamos com a série do IPCA. Analisamos os correlogramas, propomos alguns modelos e fizemos algumas previsões.

Para quem não levou o computador ou não anotou os scripts, creio que esse post pode ser bem interessante. Vale lembrar que a P1 está chegando e saber lidar com o R será muito importante. Aqui terá SOMENTE os scripts. A parte de gerar as saídas e correlogramas fica por sua conta!

#Bom pessoal, a primeira coisa que precisamos fazer é importar os dados.. 
#Como estou usando o RStudio e creio que você já sabe fazer isso, vou pular essa parte 
#Já com a base de dados dentro do programa, vamos avisar o R que 
#A série "esta no tempo"
ipca<-ts(ipca99$IPCA, start=c(1999,1), freq=12)
#Ok, agora vamos fazer um gráfico da série 
plot(ipca)
#eu nao gosto de trabalhar com essa série cheia por conta do pico entre 2000 e 2005
#vamos tirar o “efeito metalúrgico” da série..
#Vou pegar a serie a partir de 2005
ipca1<-window(ipca, start=c(2005,1),freq=12)
plot(ipca1)
#Bem melhor..
#Agora vamos fazer um teste ADF para vermos se a série é estacionária
#E se já da para começar a usar ARIMA com ela 
library(urca)
testeADFipca<-ur.df(ipca1, type=c("drift"), lags=12, selectlags=c("BIC"))
summary(testeADFipca)
#o h0 de ADF nos diz que a série possui raíz unitária. O teste rejeita a hipótese nula
#tem um drift também, mas não tem muita importância aqui para nós
#podemos começar a trabalhar com ela!
#antes de propor um modelo para a previsao do IPCA, vamos olhar para o padrão de autocorrelação da série
library(forecast)
tsdisplay(ipca1)
#Agora é hora de deixar a imaginação falar mais alto
#Duas coisas são importantes conhecer para começar a modelar, o padrão AR, o I e o MA
#Como a série é estacionária, o I nós sabemos que é zero 
#O AR e o MA são mais complicados, levando em conta o padrão sazonal da série.
#Vamos tirar a sazonalidade e olhar para a série de novo 
ipcadec<-decompose(ipca1)
ipcalimpo<-ipca1-ipcadec$seasonal 
tsdisplay(ipcalimpo)
#Agora sem sazonalidade, eu me arrisco a dizer que se parece um pouco com um processo AR(1)
#Mas a previsao de IPCA sem sazonalidade não me diz nada, então..
#Enfim, o desafio agora é modelar.. E não, não é trivial. 
#deixei a minha base de dados com uma coluna incompleta
#para testar meus modelos... Vou propor um modelo ARIMA (1,0,0)x(1,0,0) e testar
#fazendo uma previsao para abril de 2013
#Chamando a minha coluna incompleta
ipcatest<-ts(ipca99$IPCAteste, start=c(1999,1), freq=12)
ipcateste<-window(ipcatest,start=c(2005,1), freq=12)
arimateste<-arima(ipcateste, order=c(1,0,0),seasonal=list(order=c(1,0,0), freq=12))
resiteste<-residuals(arimateste)
tsdisplay(resiteste)
previsaoteste<-forecast(arimateste,h=1)
previsaoteste

Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
Apr 2013 0.4545263 0.1911108 0.7179418 0.0516671 0.8573855

#errou.. o realizado foi de 0.55.. Modelos erram e acertam, faz parte e a vida segue
#Por isso que economistas que propoe modelos que acertam muito ganham o Nobel
#Não é fácil

Agora você já sabe como fazer previsão com um ARIMA! Ontem eu fiquei quebrando a cabeça com alguns modelos e acho que econtrei um com um bom ajuste. Segue a minha previsão!

#Este é o meu modelo.. Claro que não vou contar qual é.. RÁ!
arimathomaz<-arima(.)
resthomaz<-residuals(arimathomaz)
tsdisplay(resthomaz)
previsaothomaz<-forecast(arimathomaz,h=1)
previsaothomaz

Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
Mar 2014 0.617406 0.4011491 0.8336628 0.2866696 0.9481423

Ao longo do semestre pretendo fazer posts mais completos, com os gráficos e as saídas. O problema é que isso demanda tempo e as minhas provas estão chegando, então…

Daqui pra frente, teremos muito o que conversar à respeito de Econometria e R aqui no Gustibus.

Então, até mais!