Sottopopolazione In Stata Forex
AVVISO: Il gruppo di consulenza Idre statistica sarà la migrazione del sito web per il CMS WordPress nel mese di febbraio per facilitare la manutenzione e la creazione di nuovi contenuti. Alcune delle nostre pagine più vecchie verranno rimossi o archiviati in modo tale che essi non saranno più mantenuti. Cercheremo di mantenere i reindirizzamenti in modo che i vecchi URL continueranno a lavorare nel miglior modo possibile. Benvenuti al Istituto per la ricerca e l'istruzione digitale Aiuto Consulting Group Stat dando un regalo di classe Stata Note conteggio da N a N Introduzione Stata ha due variabili integrate chiamato n e N. n è Stata notazione per il numero di osservazione corrente. n è 1 nella prima osservazione, 2 nella seconda, 3 nel terzo, e così via. N è Stata notazione per il numero totale di osservazioni. Vediamo come n e il lavoro N. Come si può vedere, l'id variabile contiene il numero di osservazione che va da 1 a 7 e nt è il numero totale di osservazioni, che è 7. conteggio con mediante l'utilizzo di n e N in collaborazione con il con il comando in grado di produrre alcuni risultati molto utili. Naturalmente, per utilizzare il comando da dobbiamo prima ordinare i nostri dati sulla dalla variabile. Ora n1 è il numero di osservazione all'interno di ciascun gruppo e n2 è il numero totale di osservazioni per ciascun gruppo. Per elencare il punteggio più basso per ogni gruppo di utilizzare il seguente: Per elencare il punteggio più alto per utilizzare ogni gruppo il seguente: Un altro uso di n Consente di utilizzare n per scoprire se ci sono numeri di ID duplicati i seguenti dati: Come si è visto, osservazioni 6 e 7 hanno gli stessi numeri ID e valori, ma punteggio diverso. Trovare duplicati Ora lascia uso N per trovare osservazioni duplicati. In questo esempio ordinare le osservazioni da parte di tutte le variabili. Poi usiamo tutte le variabili nella dichiarazione da e set set n pari al numero totale di osservazioni che sono identici. Infine, si elencano le osservazioni per cui N è maggiore di 1, identificando in tal modo le osservazioni duplicate. Se si dispone di un sacco di variabili nel dataset, potrebbe richiedere molto tempo per scrivere tutti fuori due volte. Siamo in grado di utilizzare il jolly per indica che vogliamo utilizzare tutte le variabili. Inoltre nelle ultime versioni di Stata possiamo combinare sorta e in una singola istruzione. Qui di seguito è una versione semplificata del codice che produrrà lo stesso risultato come sopra. Il contenuto di questo sito web non deve essere interpretata come un'approvazione di un particolare sito web, il libro, o di un prodotto software dall'Università di California. NOTICE: Il gruppo di consulenza Idre statistica sarà la migrazione del sito web al CMS WordPress nel mese di febbraio per facilitare mantenimento e la creazione di nuovi contenuti. Alcune delle nostre pagine più vecchie verranno rimossi o archiviati in modo tale che essi non saranno più mantenuti. Cercheremo di mantenere i reindirizzamenti in modo che i vecchi URL continueranno a lavorare nel miglior modo possibile. Benvenuti al Istituto per la ricerca e l'istruzione digitale Aiuto Consulting Group Stat dando un regalo Stata FAQ Come posso analizzare una sottopopolazione dei miei dati dell'indagine in Stata NOTA: Questa pagina è stata creata usando Stata 9. Tutto il codice in questa pagina sarà lavorare con Stata 10. Il codice in questa pagina non funziona con Stata 8 (o versioni precedenti di Stata). Quando si analizzano i dati delle indagini, è comune a voler guardare solo un certo intervistati, forse solo le donne, o solo intervistati oltre i 50 anni, quando analizzano queste sottopopolazioni (domini AKA), è necessario utilizzare l'opzione appropriata. Stata 9 ha due opzioni sottopopolazione che sono molto flessibile e facile da usare. Utilizzando l'opzione sottopopolazione (s) è estremamente importante quando si analizzano i dati delle indagini. Se il set di dati è sottoinsieme, il che significa che le osservazioni non devono essere inclusi nella sottopopolazione vengono eliminati dal set di dati, gli errori standard delle stime non possono essere calcolati in modo corretto. Quando viene utilizzata l'opzione sottopopolazione (s), solo i casi definiti dalla sottopopolazione sono utilizzati nel calcolo della stima, ma tutti i casi vengono utilizzati nel calcolo degli errori standard. Per ulteriori informazioni su questo problema, vedere tecniche di campionamento, Terza edizione di William G. Cochran (1977) e una piccola area di stima di J. N. K. Rao (2003). Per motivi di consistenc y, useremo il comando media per tutti i nostri esempi. Tuttavia, il Subpop e più opzioni funzionano lo stesso per tutti i comandi Svy. Inizieremo cercando in media del nostro variabile continua, ell. Successivamente, si prenderà in considerazione due variabili da utilizzare con l'opzione Subpop, yrrnd. che è codificato 01, ed entrambi. che è codificato 12. Come si vedrà, l'opzione Subpop gestisce queste due variabili in modo diverso. Qui possiamo vedere che yrrnd è codificato 01. Avviso nell'output del SVY (Questa opzione mancante è qui usato per mostrare che non ci sono valori mancanti per questa variabile Ci vorranno sapere questo più avanti..): Il comando scheda che ci sono 789,6 casi codificati 1. (non è un numero intero, perché stiamo valutando questo valore utilizzando i pesi di probabilità.) nell'output del SVY: comando di dire, vediamo anche che 789.552 casi sono inclusi nella sottopopolazione. Ora proviamo ad utilizzare una variabile in codice 12 invece di 01. Qui possiamo vedere che entrambi è codificato 12. (Questa opzione mancante è qui utilizzato per mostrare che non ci sono valori mancanti per questa variabile. Vorremo conoscere questo più avanti .) si noti nell'output del SVY: comando di scheda che ci sono 1888 casi codificati 1. Tuttavia, nell'output del SVY: significa comando, vediamo che tutte le osservazioni, 6194 casi, sono inclusi nel sottopopolazione. Questo perché l'opzione Subpop deve avere una variabile truefalse. Come indicato a pagina 39 del manuale Survey Stata 9, quando l'opzione Subpop viene utilizzato, il sottopopolazione è in realtà definita da gli 0 (falso), che indicano i casi a essere escluse dal sottopopolazione. I valori non-0 sono incluse nell'analisi, ad eccezione dei valori mancanti, che sono esclusi dall'analisi. Perché non abbiamo casi codificati come 0, tutti i casi sono inclusi nella sottopopolazione, come spiegato nella nota in uscita. Ora lascia creare una copia di entrambi e ricodificare il 1s a 0s. Ci sarà anche impostare alcuni valori a mancare, per vedere cosa succede con i valori mancanti nella variabile sottopopolazione. L'output del comando scheda ci mostra che la ricodifica è andato come previsto. L'uscita del SVY: significa spettacoli di comando che il tutti i casi non codificato 0 o mancanti (i 424 casi codificati come 2) sono inclusi nella sottopopolazione. Si noti la nota che Stata fornisce quando la variabile sottopopolazione non è codificata 01. È inoltre possibile utilizzare se al momento di definire la vostra sottopopolazione. Va sottolineato che questo è molto diverso da utilizzare se per rimuovere casi dall'analisi. Utilizzando se nell'opzione Subpop non rimuove casi dall'analisi. I casi esclusi dalla sottopopolazione dal se sono ancora utilizzati nel calcolo degli errori standard, come dovrebbero essere. È possibile utilizzare uno o più di Subpop con più variabili per creare la sottopopolazione che si desidera. Vediamo alcuni esempi utilizzando l'opzione sopra. In primo luogo, useremo yrrnd. la nostra variabile 01, poi entrambi. il nostro 12 variabile. Si noti che l'uscita è differente dalla output utilizzando l'opzione Subpop dal fatto che entrambe le categorie della variabile sono noti, e non vi è alcuna nota quando si utilizza una variabile 12. Si prega di notare che l'opzione sopra è disponibile solo per i comandi media del sondaggio. proporzione . Rapporto e totale. Ora lascia utilizzare sia yrrnd e sia come le variabili di sottopopolazione. Prima useremo il SVY: comando di scheda per garantire che ci sono casi in tutte e quattro le categorie. Poi usiamo il SVY: comando con l'opzione su significare. Qui di seguito abbiamo creato una nuova variabile da Emer con quattro categorie. Poi useremo questa variabile con yrrnd ed entrambi tutte le combinazioni delle variabili sono mostrati in uscita. Questo è spesso molto utile e si evita di dover creare una nuova variabile sottopopolazione. Tuttavia, se ognuno di variabili sono molte categorie, l'uscita può diventare lungo e ingombrante, soprattutto se si è interessati solo in poche combinazioni di categorie. L'opzione Subpop può essere combinata con l'opzione sopra. Questo è utile perché se non può essere utilizzato con l'opzione sopra. Combinando le opzioni, si può avere quotthe meglio di entrambi worlds. quot Il contenuto di questo sito web non deve essere interpretata come un'approvazione di un particolare sito web, il libro, o di un prodotto software dalla University of California.
Comments
Post a Comment