Questa struttura di dati è piuttosto inadatta allo scopo. Assumendo un id identificativo è necessario rimodellare. per esempio. Poi una media mobile è facile. Utilizzare tssmooth o semplicemente generare. per esempio. Più sul perché la struttura dei dati è del tutto inadatto: Non solo il calcolo di una media mobile hanno bisogno di un ciclo (che non prevedono necessariamente Egen), ma sarebbe la creazione di diverse nuove variabili aggiuntive. Utilizzando quelli in qualsiasi analisi successiva sarebbe da qualche parte tra scomodo e impossibile. EDIT Ill dare un loop del campione, mentre non si muove dalla mia presa di posizione che è la tecnica povera. Non vedo una ragione dietro la convenzione di denominazione per cui P1947 è un mezzo per 1943-1945 presumo questo è solo un errore di battitura. Consente di supporre che abbiamo i dati per il 1913-2012. Per mezzo di 3 anni, si perde un anno presso ogni estremità. Questo potrebbe essere scritto in modo più conciso, a scapito di una raffica di macro all'interno di macro. Utilizzando pesi disuguali è facile, come sopra. L'unica ragione per usare egen è che si pretende molto rinunciare se ci sono mancanze, che quanto sopra farà. Come una questione di completezza, si noti che è facile da gestire missings senza ricorrere a Egen. e il denominatore Se tutti i valori sono mancanti, questo si riduce a 00, o mancante. Altrimenti, se un valore è mancante, si aggiunge 0 al numeratore e al denominatore 0, che è la stessa di ignorarlo. Naturalmente il codice è tollerabile come sopra per le medie di 3 anni, ma sia per quel caso o per una media su più anni, si dovrebbe sostituire le linee sopra da un loop, che è ciò che egen does. Stata: Analisi dei dati e statistica Software Nicholas J il comando più evidente. Cox, Durham University, UK Christopher Baum, Boston college Egen, ma () e le sue limitazioni Statarsquos per calcolare medie mobili è la funzione ma () di Egen. Data un'espressione, crea una media - periodo movimento di tale espressione. Per impostazione predefinita, viene preso come 3. deve essere dispari. Tuttavia, come l'inserimento manuale indica, Egen, ma () non può essere combinata con by-variabili:. e, per questo motivo, non è applicabile ai dati panel. In ogni caso, si erge al di fuori del set di comandi appositamente scritte per le serie temporali vedi serie storiche per i dettagli. approcci alternativi per calcolare le medie per i dati panel in movimento, ci sono almeno due scelte. Entrambi dipendono l'insieme di dati essendo stato tsset in anticipo. Questo è molto vale la pena di fare: non solo è possibile risparmiare più volte specificando variabile variabile e l'ora del pannello, ma si comporta in modo Stata elegantemente dato eventuali lacune nei dati. 1. Scrivi la tua definizione utilizzando generare Uso degli operatori di serie temporali, come L. e F.. dare la definizione della media mobile come argomento di una dichiarazione di generare. Se si esegue questa operazione, si sta, naturalmente, non limitato alla altrettanto ponderate (non ponderata) centrato medie calcolate da Egen in movimento, ma (). Ad esempio, ugualmente ponderato tre periodo medie mobili sarebbe dato da alcuni pesi e possono essere facilmente specificati: È possibile, ovviamente, specificare un'espressione come log (myvar) al posto di un nome di variabile, come myvar. Un grande vantaggio di questo approccio è che Stata fa automaticamente la cosa giusta per i dati panel: ingresso e uscita valori vengono elaborati all'interno di pannelli, così come la logica impone che dovrebbero essere. Lo svantaggio più evidente è che la linea di comando può ottenere piuttosto lungo se la media mobile coinvolge diversi termini. Un altro esempio è una media mobile unilaterale basata solo su valori precedenti. Questo potrebbe essere utile per generare un'aspettativa di adattamento di quello che una variabile sarà basato esclusivamente su informazioni aggiornate: ciò che qualcuno potrebbe prevedere per l'esercizio in corso sulla base degli ultimi quattro valori, utilizzando uno schema fisso di ponderazione (un ritardo di 4 periodo potrebbe essere soprattutto comunemente usato con timeseries trimestrali.) 2. Usare Egen, filtro () da SSC utilizzare il filtro funzione di egen scritto dall'utente () dal pacchetto egenmore su SSC. In Stata 7 (aggiornato dopo il 14 novembre 2001), è possibile installare questo pacchetto dopo che aiutano punti egenmore ai dettagli del filtro (). I due esempi sopra sarebbe resa (In questo confronto la generano approccio è forse più trasparente, ma vedremo un esempio del contrario in un attimo.) I ritardi sono un numlist. conduce essendo GAL negativi: in questo caso -11 espande a -1 0 1 o portare 1, lag 0, in ritardo 1. I ficients COEF, un'altra numlist, moltiplicare i corrispondenti elementi in ritardo di sviluppo o di leader: in questo caso, tali elementi sono F1.myvar . MyVar e L1.myvar. L'effetto dell'opzione normalizzare è in scala ogni coefficiente per la somma dei coefficienti in modo che coef (1 1 1) normalizzare equivale a coefficienti di 13 13 13 e coef (1 2 1) normalizzare equivale a coefficienti di 14 12 14 . È necessario specificare non solo i ritardi, ma anche i coefficienti. Perché Egen, ma () prevede il caso altrettanto ponderata, la motivazione principale per Egen, filtro () è quello di sostenere il caso ineguale ponderata, per i quali è necessario specificare coefficienti. Si potrebbe anche dire che obbliga gli utenti di specificare coefficienti è un po 'di pressione in più su di loro per pensare a quello coefficienti che vogliono. La giustificazione principale per pesi uguali è, immaginiamo, la semplicità, ma pesi uguali avere pessime proprietà del dominio della frequenza, per citare solo una considerazione. Il terzo esempio di cui sopra potrebbe essere uno dei quali è quasi complicato come l'approccio di generare. Ci sono casi in cui Egen, filtro () fornisce una formulazione più semplice di generare. Se si desidera un filtro binomiale di nove termine, che i climatologi trovano utile, poi guarda forse meno orribile di, e più facile da ottenere rispetto, proprio come con il generare approccio, Egen, filtro () funziona correttamente con dati panel. Infatti, come già detto, esso dipende il set di dati essendo stato tsset anticipo. Un consiglio grafica Dopo aver calcolato i tuoi medie mobili, probabilmente voler guardare un grafico. Il comando tsgraph scritto dall'utente è intelligente su set di dati tsset. Installarlo in un up-to-date Stata 7 da SSC tsgraph Inst. Che dire sottoinsiemi con se nessuno dei precedenti esempi fanno uso di se restrizioni. Infatti Egen, ma () non permetterà, se da specificare. Di tanto in tanto la gente vuole usare se il calcolo medie mobili, ma il suo uso è un po 'più complicato di quanto non sia di solito. Che cosa ci si può aspettare da una media mobile calcolata con se. Cerchiamo di identificare due possibilità: l'interpretazione debole: non voglio vedere nessun risultato per le osservazioni esclusi. Forte interpretazione: io non neanche voglia di utilizzare i valori per le osservazioni esclusi. Ecco un esempio concreto. Supponiamo come conseguenza di una condizione if, osservazioni 1-42 sono inclusi ma non osservazioni 43 su. Ma la media mobile per 42 dipenderà, tra l'altro, sul valore per l'osservazione 43 se la media estende avanti e indietro ed è di lunghezza almeno 3, e sarà simile dipenderà alcune osservazioni 44 in poi in alcune circostanze. La nostra ipotesi è che la maggior parte delle persone sarebbe andare per l'interpretazione deboli, ma se questo è corretto, Egen, filtro () non supporta se uno dei due. È sempre possibile ignorare ciò che si vuole donrsquot o anche impostare valori indesiderati a mancare in seguito utilizzando sostituire. Una nota sui risultati alle estremità della serie mancante Perché medie mobili sono funzioni di ritardi e conduce, egen, MA () produce mancante in cui non esistono i ritardi e conduce, all'inizio e alla fine della serie. Un'opzione nomiss costringe il calcolo delle più brevi, medie mobili non centrati per le code. Al contrario, né generare nè Egen, filtro () lo fa, o consente, nulla di speciale per evitare risultati mancanti. Se uno dei valori necessari per il calcolo è mancante, quindi questo risultato è mancante. Spetta agli utenti di decidere se e quanto la chirurgia correttiva è richiesto per queste osservazioni, presumibilmente dopo aver guardato il set di dati e considerando ogni scienza di base che può essere portato a tempi bear. Often potremmo essere interessati a generare una media mobile spaziale di un caratteristica X. si può usare questa media mobile per aiutare il controllo per l'eterogeneità della popolazione che può essere legato alla distribuzione spaziale delle osservazioni. Per fare questo abbiamo bisogno di avere un metodo per generare una media spaziale. I Codice manualmente perché non ho esperienza con i dati spaziali in Stata e non so che cosa il costruito nel comando è (ammesso che ve ne sia uno). Se siete solo in cerca per la media spaziale allora si può favorire la costruzione di comando. Tuttavia, questo metodo è flessibile e facilmente modificabile se per esempio si desidera utilizzare le misure al di là della distanza euclidea formula 2D e sarebbe invece preferisce la formula 3D o formula nD davvero. Allo stesso modo lo spostamento statistica medio potrebbe facilmente essere sostituito spostando varianza o qualsiasi altra statistica che potrebbe essere generato tramite il comando Egen. Così questo esercizio potrebbe essere utile esaminare anche se ridondanti. globale Nobs 1000 chiare oss set Nobs Generare 2D coordinate gen Latt runiform () 100 gen longg runiform () 100 Generare la variabile di interesse. La variabile avrà una componente casuale e un componente spazialmente dipendente. Gen X (lattlongg) 100rnormal () due (dispersione Latt X) (dispersione longg X) Possiamo vedere che se c'è una tendenza generale a valori più grandi come longitudine o latitudine aumento è difficile identificare un modello forte. Ora consente di calcolare la media mobile di X per ogni osservazione. (C'è probabilmente un comando per questo che io non lo so). gen Xave. gen dist. forv i1Nobs calcolare la distanza di tutti i punti da OB sostituisco dist ((Latt-Latti) 2 (longg-longgi) 2) .5 Calcolare la media di X se la distanza è all'interno della gamma di interessi Egen tempx media (X) se distltmeanrange sostituire Xave tempx se ni goccia tempx due (dispersione Latt Xave) (dispersione longg Xave) Ora, guardando la media mobile possiamo facilmente identificare visivamente l'effetto della posizione sul valore atteso di X. Announcement e 'il mio primo post e lo farò cercare di essere il più chiaro possibile. Il collegamento per il database principale è alla fine del post. Contesto Sto usando StataSE 12,0 sotto Windows 10. Ho iniziato con Stata solo poche settimane fa, e sto cercando di imparare da solo per un incarico a causa di qualche giorno (perché ogni tabella o figura mi portarono giorni e giorni) : replicare i quotDoes carta obbligatoria frequenza scolastica Affect Schoolig e Earningsquot: web. stanford. edu pistaangrist. pdf che consiste nel mostrare che le persone nate in ultimi trimestri degli anni hanno più l'educazione, in media, di quelli nati nei primi trimestri a causa della scuola dell'obbligo legislazione. I primi dati disegnare un grafico del numero medio di anni di istruzione (EDUC variabile) per tutte le persone nate un certo anno (YOB variabile per anno di nascita) durante un determinato trimestre (QOB). Vi è una crescente tendenza generale e detrend i dati, che utilizzano una media mobile (figura IV), che è dove sono stato bloccato per gli ultimi 5 giorni. Problema Nel database, ci sono 27 variabili tra i quali V4 rinominati EDUC, V27 rinominato YOB (anno di nascita), e V18 rinominato QOB (quarto di nascita). Ciò che è necessario per la media mobile è, per ogni gruppo di persone nate nell'anno C e quarto j, calcolando il numero medio di anni di istruzione non per questo anno e trimestre, ma per il trimestre appena prima, 2 quarti prima, un quarto più tardi e 2 quarti successivamente (spiegato p. 985 della carta). Ad esempio, se guardo gli uomini nati tra il 1930 e il 1939 come in questa figura (figura IV di questo articolo:. Onedrive. liveredirresi ntphoto2cpng), ho bisogno di iniziare con la coorte nata nel 1930, 3 ° trimestre e calcolare il numero medio di anni di istruzione di coloro che sono nati nel 1930, 2 ° trimestre (nato un quarto prima della data di coorte), lo stesso per i nati nel 1930, 1 ° trimestre (nato il 2 quarti prima della data di coorte), lo stesso per i nati nel 1930, 4 ° trimestre (un quarto dopo la data di coorte), e lo stesso per i nati nel 1931, 1 ° trimestre (2 trimestri dopo la data di coorte). Poi la media mobile è ottenuta sommando questi 4 valori e dividendo per 4. L'intero processo deve essere ripetuto per ogni coorte tra il 1930, 3 ° trimestre e il 1939, 2 ° trimestre. Do-File per il fai-lima (onedrive. liveredirresid6919D329B3BF1EF23227ampauthkeyAO2cxEN AGpZMgsMampithintfile2cdo), ho iniziato con il modello delle altre figure e ha cercato di usare ciclo foreach e molte altre cose (non ricordo l'errore non messagesdid so che stavo per postare qui) ma ancora non capire come dire Stata: quotfor ogni YOBQn. calcolare media (EDUC) del YOBQ n-1, YOBQ n-2, YOBQ n1, YOBQ n2quot. Per fare la somma e dividere per 4 dopo che dovrebbe essere più facile. Mi è stato dato un eccezionale suggerimento f rom nella assistente di insegnamento: quot provare il comando tssmooth. Per prima cosa è necessario creare una variabile di tempo per il quale il comando di gruppo egen sarà molto useful. quot, ma secondo la mia ricerca sulla quotegenquot e quottssetquot nei manuali di dati e nel libro di Cameron amplificatore Trivedi, quotEconometrics utilizzando Stataquot (ultimo link): statamanuals14degen. tfolder2cdta statamanuals14u11.p statamanuals14gsw11.pdf. statamanuals14u13.p Languagesyntax. itsubscripting onedrive. liveredirresi. intfile2cpdf dovrei tsset i dati prima tssmooth ma non ho ottenuto oltre questa fase dal momento che a quanto pare, la notazione n non è consentito con quotegenquot (errore R (101) quotweights non allowedquot) e sono ancora molto confuso con il modo di coniugare Egen, tsset e tssmooth. Sarebbe bello se qualcuno mi potrebbe aiutare con il modo di risolvere i quotweights non allowedquot errore e come combinare i comandi quotegenquot, quottssetquot, e quottssmoothquot. Grazie mille Postscript: qui è il database per la via onedrive. liveredirresi. tfolder2cdta Nota: ho il fai-file per i più importanti altre figure e tabelle di questo articolo, ad eccezione tabella I, ma questo file non è probabilmente necessaryjust per info: onedrive. liveredirresi. hintfile2cdo Ultima modifica di Amarylis Durand 25 Mar 2016, 01:55. 25 Mar 2016, 22:50 Ecco una versione più corta della mia domanda: come evitare l'errore sotto (R451 in grassetto) e come dire Stata che la media mobile di quotmedstay1quot deve essere calcolato per ogni valore di TPS da YOB QOB per tutti quelli nati nello stesso anno e nello stesso trimestre, sorta aumentando anni e quarti e calcolare il numero medio di anni di istruzione per YOB QOB. Ordina: Egen medstay1 media (EDUC) generano una variabile nuova YOBNew perché il comando YQ richiede il primo argomento ad essere tra il 1000 e il 9999 ei nostri dati per YOB nel 1980 censimento è tra il 30 e il 49 invece del 1930 e il 1949 Gen YOBNewYOB sostituire YOBNew YOB1900 se CENSUS80 generare un tempo variabile che ha il formato richiesto in aiuto tsset gen tpsyq (YOBNew, QOB) formato TQ TPS le seguenti istruzioni ritorna R451. ripetuti i valori di tempo in pannello, probabilmente perché ci sono migliaia di persone nate nello stesso anno e nello stesso trimestre, ovviamente con lo stesso numero medio di anni di istruzione. Come evitare questo errore tsset medstay1 tps istruzioni per avere la MA media mobile ma voglio lo spostamento della media di medstay1 da calcolare per ogni valore della quottpsquot timevariable. Quale comando mi avrebbe permesso di fare questo o si fa automaticamente tssmooth Ma Ma medstay1. finestra (2 0 2) Spero che qualcuno possa aiutare.
No comments:
Post a Comment