Uncategorized

Para a galera da 109!

Então pessoal, o R nos deixou. Por mais triste que isso pareça ser, não há motivos para pânico. O Stata é muito bom. O problema é que é pago e a licença não é das mais baratas, mas enfim, essa é a vida.

Segue abaixo os comando necessários para resolver o exercício empírico 10.2 do livro Introduction to Econometrics 3rd Edition, Stock and Watson. A ideia inicial era fazer algo mais completo, mas como meu tempo está curto vou colocar só os comandos e as saídas. A ideia é facilitar a vida de quem quer estudar e não entregar tudo de mão beijada. Sou aluno da matéria também, aprendo fazendo isso e a intenção principal é essa, então, a probabilidade de surgirem outros posts como esse é alta.

Os dois últimos itens do exercício vou ficar devendo. São quase 21:00 de uma quinta feira e estou na faculdade ainda, trabalhei a tarde inteira e estou um pouco cansado. Queria estar com a minha namorada agora, mas como não tenho uma, fico com a econometria mesmo.

Vamos lá!

Os acidentes automobilísticos são os principais causadores de mortes entre os americanos com idade entre 5 e 32 anos. Através de alguns incentivos políticos, o governo federal tem encorajado os estados a criarem uma lei que torne o uso do cinto de segurança obrigatório. Neste exercício iremos analisar o quão eficientes essas leis têm sido em aumentar o uso do cinto e diminuir o número de fatalidades. No site do livro http://www.pearsonhighered.com/stock_watson você encontrará o link da base de dados Seatbelts que contem os dados em painel de 50 estados mais o distrito de Columbia para os anos de 1983 até 1997.

1) Estime o efeito do uso do cinto de segurança na taxa de fatalidade regredindo FatalityRate em sb_useage, speed65, speed70, ba08, drinkage21, ln(income) e age. O resultado da estimação nos sugere que o uso do cinto de segurança reduz o número de fatalidades?

Vou colocar um “.” na frente dos comando para melhorar a visualização.

. encode state, gen(state1)
. xtset state1 year
. gen lnincome=ln(income)
. regress fatalityrate sb_useage speed65 speed70 ba08 drinkage21 lnincome age



Source |       SS       df       MS              Number of obs =     556
-------------+------------------------------           F(  7,   548) =   95.41
       Model |  .007711649     7  .001101664           Prob > F      =  0.0000
    Residual |  .006327757   548  .000011547           R-squared     =  0.5493
-------------+------------------------------           Adj R-squared =  0.5435
       Total |  .014039406   555  .000025296           Root MSE      =   .0034

------------------------------------------------------------------------------
fatalityrate |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
   sb_useage |   .0040684   .0012158     3.35   0.001     .0016803    .0064565
     speed65 |   .0001479   .0004029     0.37   0.714    -.0006436    .0009394
     speed70 |   .0024045   .0005112     4.70   0.000     .0014003    .0034086
        ba08 |  -.0019246   .0004447    -4.33   0.000    -.0027982    -.001051
  drinkage21 |   .0000799   .0008756     0.09   0.927    -.0016401    .0017998
    lnincome |  -.0181444   .0009311   -19.49   0.000    -.0199733   -.0163155
         age |  -7.22e-06   .0001089    -0.07   0.947    -.0002212    .0002067
       _cons |   .1965469   .0082232    23.90   0.000     .1803941    .2126998
------------------------------------------------------------------------------

2) Os resultados mudam quando se usa efeito fixo? Tente explicar de forma intuitiva porque os resultados mudam. (Lembre-se do viés de variável omitda..)

. xtreg fatalityrate sb_useage speed65 speed70 ba08 drinkage21 lnincome age, fe vce(cluster state1)

Fixed-effects (within) regression               Number of obs      =       556
Group variable: state1                          Number of groups   =        51

R-sq:  within  = 0.6868                         Obs per group: min =         8
       between = 0.1957                                        avg =      10.9
       overall = 0.3896                                        max =        15

                                                F(7,50)            =     96.72
corr(u_i, Xb)  = -0.1332                        Prob > F           =    0.0000

                                (Std. Err. adjusted for 51 clusters in state1)
------------------------------------------------------------------------------
             |               Robust
fatalityrate |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
   sb_useage |  -.0057748   .0016693    -3.46   0.001    -.0091276    -.002422
     speed65 |   -.000425   .0004555    -0.93   0.355    -.0013399    .0004898
     speed70 |   .0012333   .0003483     3.54   0.001     .0005337    .0019329
        ba08 |  -.0013775   .0003751    -3.67   0.001    -.0021308   -.0006241
  drinkage21 |   .0007453   .0007184     1.04   0.305    -.0006976    .0021883
    lnincome |  -.0135144   .0023849    -5.67   0.000    -.0183047   -.0087241
         age |   .0009787   .0007461     1.31   0.196    -.0005199    .0024772
       _cons |   .1209958   .0184235     6.57   0.000     .0839912    .1580005
-------------+----------------------------------------------------------------
     sigma_u |  .00383103
     sigma_e |   .0017871
         rho |  .82128567   (fraction of variance due to u_i)
------------------------------------------------------------------------------

3) Os resultados mudam quando se usa efeito fixo no estado e no tempo?

. areg fatalityrate sb_useage speed65 speed70 ba08 drinkage21 lnincome age, absorb(state1) vce(cluster state1)

Linear regression, absorbing indicators           Number of obs   =        556
                                                  F(   7,     50) =      87.90
                                                  Prob > F        =     0.0000
                                                  R-squared       =     0.8867
                                                  Adj R-squared   =     0.8737
                                                  Root MSE        =     0.0018

                                (Std. Err. adjusted for 51 clusters in state1)
------------------------------------------------------------------------------
             |               Robust
fatalityrate |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
   sb_useage |  -.0057748    .001751    -3.30   0.002    -.0092919   -.0022577
     speed65 |   -.000425   .0004778    -0.89   0.378    -.0013847    .0005346
     speed70 |   .0012333   .0003654     3.38   0.001     .0004994    .0019671
        ba08 |  -.0013775   .0003935    -3.50   0.001    -.0021677   -.0005872
  drinkage21 |   .0007453   .0007536     0.99   0.327    -.0007684     .002259
    lnincome |  -.0135144   .0025018    -5.40   0.000    -.0185394   -.0084894
         age |   .0009787   .0007826     1.25   0.217    -.0005933    .0025507
       _cons |   .1209958   .0193262     6.26   0.000      .082178    .1598137
-------------+----------------------------------------------------------------
      state1 |   absorbed                                      (51 categories)

4) Qual das especificações usadas até o momento se aproximam mais da realidade? Por quê?

Pense que o uso de efeitos fixos, tanto no tempo quanto nos estados, nos ajudam a medir variáveis que não são observáveis, mas caso sejam omitidas, geram viés em nossa análise e jogam o trampo todo no lixo. O habito dos habitantes de cada estado em relação ao uso do cinto de segurança pode ser uma variável fixa no tempo, mas não entre os estados enquanto uma lei federal que obrigue todos os estados a fiscalizar o uso de cinto de segurança pode ser uma variável que varia no tempo, mas não entre os estados. Logo, por levar em consideração o efeito de variáveis não observáveis, o terceiro modelo se aproxima mais da realidade.

Todo mundo usando cinto!
Todo mundo usando cinto!

5) Usando os resultados obtidos na questão 3, analise o valor do coeficiente de sb_useage. É grande? Pequeno? Quantas vidas seriam salvas se a taxa do uso de cinto de segurança subisse de 52% para 90%?

Para responder a pergunta é necessário entrar em alguns detalhes à respeito da base de dados. Esses “detalhes” você encontra no link Seatbelts_Description, no site do livro que está no enunciado da questão.

Bom pessoal, espero ter ajudado. Mesmo.

Gostei do Stata. No R, como há maior “liberdade” para trabalhar e criar, as coisas acabam sendo mais intuitivas, o que facilita um pouco. Andei olhando alguns fóruns na internet e pude perceber que o Stata está presenta em muitas universidades dos EUA e da Europa, então, é um privilégio também ter acesso a essa ferramenta. Até agora vimos o Eviews na Econometria 1, o R na Econometria 2 e o Stata na Econometria 3, o que é muito bom.

Enfim, é isso ai pessoal. Um abraço.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s