Einige Stata-Befehle Allgemeine Plotterbefehle Plotten eines Histogramms einer Variablen: graph vn, bin (xx) Plot ein Histogramm einer Variablen mit Frequenzen: graph vn, bin (xx) freq Plot ein Histogramm einer Variablen mit normaler Näherung: graph vn , Bin (xx) norm wobei xx die Anzahl der Bins ist. Plot ein Boxplot einer Variable: graph vn, box Plot nebeneinander Kasten-Plots für eine Variable (vone) nach Kategorien einer anderen Variable vtwo. (Vtwo sollte kategorisch sein): sort vtwo graph vone, box von (vtwo) Ein Scatterplot von zwei Variablen: graph vone vtwo Eine Matrix von Scatterplots für drei Variablen: graph vone vtwo vthr, matrix Ein Scatterplot von zwei Variablen mit Die Werte einer dritten Stelle, die an Stelle von Punkten auf dem Graphen verwendet wird (vthr kann numerische Werte enthalten oder Kategorien wie männlich (m) und weiblich (f)) angeben: graf von v v, Symbol (vthr) Normaler Quantilplot qnorm Vn Allgemeine Befehle Um Mittelwerte und Standardabweichungen aller Variablen zu berechnen: Zusammenfassen oder mit Hilfe einer Abkürzung summ Um Mittelwerte und Standardabweichungen der ausgewählten Variablen zu berechnen: fassen Sie von v v ot vthr zusammen oder mit einer Abkürzung summ von v v o o v thr Um mehr numerische Zusammenfassungen zu erhalten Für eine Variable: summ vone, Detail Korrelation zwischen zwei Variablen: korrekt von vewo Um alle Werte zu sehen (alle Variablen und alle Beobachtungen, die nicht für große Datensätze zu empfehlen sind): list Um Werte für zwei Variablen aufzulisten: list vone vtwo Um die erste Liste aufzurufen 10 Werte für zwei Variablen: Liste vone vtwo in 110 Liste der letzten 10 Werte für zwei Variablen: Liste vone vtwo in -10l (Das Ende dieses Befehls ist minus 10letter l.) Tabellen Tabulat Variable vn: tabulate vn oder, mit einem Abkürzung, tab vn Kreuz tabellarisieren zwei Variablen: tab vone vtwo Kreuz tabellieren zwei Variablen, enthalten eine oder mehrere der Optionen, um Spalten-, Zeilen - oder Zelle-Prozente zu erzeugen und den Druck von Frequenzen zu unterdrücken: tab vone vtwo, Spaltenzeile Zelle Generierung neuer Variablen Allgemeines . Generieren Sie den Index der Fälle 1,2, ldots, n) (dies kann nützlich sein, wenn Sie die Daten sortieren und dann die Daten in das ursprüngliche Formular wiederherstellen wollen, ohne die Daten neu zu laden): erzeugen Sie Fall n oder verwenden Sie eine Abkürzung gen casen Multiplizieren Sie die Werte in vx mit b und addieren Sie a. Ergebnisse in vy generieren: gen vy a b vx Eine Variable mit allen Werten generieren 0: gen vone0 Eine Variable mit Werten 0 erzeugen, wenn vtwo nicht größer als c ist. Dann den Wert 1: gen vone0 ersetzen vone1, wenn vtwogtc Zufallszahlen. Anzahl der Beobachtungen auf n. Set obs n Setzen von Zufallszahlen auf XXXX, Voreinstellung ist 1000: Setzen von Samen XXXX Generieren Sie n einheitliche Zufallsvariablen (gleiche Chance aller Ergebnisse zwischen 0 und 1: gen vnuniform () Generieren Sie n einheitliche Zufallsvariablen (gleiche Chance für alle Ergebnisse zwischen a Und b. Gen vna (ba) einheitlich () Generieren Sie n diskrete einheitliche Zufallsvariablen (gleiche Chance aller Ergebnisse zwischen 1 und 6 (Diese Befehle simulieren das Rollen eines sechsseitigen Würfels): gen vn1int (6uniform ()) Normaldaten mit Mittelwert 0 und Standardabweichung 1: gen vn invnorm (einheitlich) Normalwerte mit Mittelwert mu und Standardabweichung sigma Gen vn mu sigma invnorm (einheitlich ()) Regression Berechnen Sie eine einfache Regressionsgerade (vy ist Antwort, vx ist Prädiktor): regress Vy vx Vorhersagen berechnen, neue Variable erzeugen yhat: Vorhersage yhat Erzeugung des Streudiagramms mit der Regressionslinie hinzugefügt: Diagramm vy yhat vx, verbinden (.s) Symbol (oi) Berechnung der Residuen, Erstellen neuer Variable tt Residuen: Residuen vorherbestimmen Reste erzeugen (0) Punkte mit größtem und kleinstem Restwert sortieren: Restlistenliste in 15 Liste in -5l sortieren (Der letzte Befehl ist minus 5letter l.) Berechnen Sie die Regressionsgleichung (vy ist die Antwort, Vone, vtwo und vthr sind Prädiktoren): regress vy vone vtwo vthr Wichtige Hinweise zum Stammbefehl Es gibt eine Störung mit dem Statas-Stammbefehl für Stamm-und-Blatt-Plots. Die Stammfunktion scheint die Daten dauerhaft neu anzuordnen, so dass sie nach der Variablen sortiert werden, für die die Stamm-und-Blatt-Zeichnung geplottet wurde. Der beste Weg, um dieses Problem zu vermeiden ist, zu vermeiden, tun, alle Stamm-und-Blatt-Diagramme (nicht Histogramme statt). Allerdings, wenn Sie wirklich wollen, ein Stiel-und-Blatt-Diagramm zu tun, sollten Sie immer eine Variable, die die ursprünglichen Beobachtungsnummern (genannt Index, zum Beispiel). Ein Befehl hierfür ist: generieren Index n Wenn Sie dies tun, können Sie die Daten nach dem Index der Stamm - und Blattwerke nach der Indexvariablen (Stata-Befehl: Sortierindex) neu sortieren, damit die Daten wieder da sind Die ursprüngliche Bestellung. Befehle. Hier sind einige weitere Befehle, die nützlich sein können (dies ist keine erschöpfende Liste aller Stata-Befehle): allgemeine ANOVA-, ANCOVA - oder Regression-Wiederholungsoperationen für Kategorien eines variablen Konfidenzintervalles für Mittel löscht den vorherigen Datensatz aus der Speicherkorrelation Zwischen Variablen beschreibt kurz die Daten (von obs, Variablennamen, etc.) Verteilung Diagnoseplots eliminieren Variablen aus dem Speicher bessere Alternative zu Input für Macs schafft neue Variablen (zB generieren Jahre close - start) allgemeine Graphikbefehl (dieser Befehl hat viele Optionen) Können Sie eine Teilmenge von Beobachtungen (zB Liste, wenn Radius gt 3000) in Rohdaten listet den gesamten Datensatz im Speicher (Sie können auch nur bestimmte Variablen) speichern oder drucken. Nicht-Stata-Format-Dataset (ASCII oder Textdatei) Stata ouput (mit Ausnahme von Graphen) Keyword-Suche von Befehlen, oft Vorläufer zur Oneway-Analyse von Varianz-Partial-Korrelationskoeffizienten helfen Text-Modus (grobe) Streudiagramme berechnete vorhergesagte Werte (y-Hut), Residuen (gewöhnliche, standardisierte und studentisierte), Hebel, Köche Abstand, Standardfehler der vorhergesagten Einzelperson y. Standardfehler des vorhergesagten Mittelwertes y. Standardfehler des Residuals aus Regression2.9 Regression Diagnostics Alle in den Skripten erörterten Diagnosemaßnahmen können in Stata berechnet werden, einige in mehr als einer Weise. Insbesondere können Sie nach dem Regress im Handbuch Stata über den Befehl predict lesen. In diesem Abschnitt werden wir mit der additiven Analyse des Kovarianzmodells des vorherigen Abschnitts zusammenarbeiten. Um die Eingabe des Modells jedes Mal zu speichern, wenn wir es brauchen, können wir ein lokales Makro definieren. Nun können wir unser Modell mit dem folgenden Befehl anpassen. Beginnen wir mit den Residuen. Der einfachste Weg, um sie zu erhalten, ist als Optionen des Vorhersagebefehls. Geben Sie die Option res für die rohen Restwerte, rstand für die standardisierten Residuen und rstud für die studentisierten (oder knauserigen) Residuen an. Lassen Sie uns alle drei erhalten: Um die diagonalen Elemente der Hutmatrix und der Köche zu erhalten, verwenden wir zwei weitere Optionen der Vorhersage. Hut und Koch. Wir sind nun bereit, Tabelle 2.29 in den Notizen zu drucken. Hier ist ein einfacher Weg, die in Tabelle 2.29 hervorgehobenen Fälle zu finden, die mit standardisierten oder gebückten Resten größer als 2 in der Größenordnung: Wir verwenden einen Skalar, um die maximal zulässige Hebelkraft zu berechnen Ist 2pn im Allgemeinen, und dann die Fälle, die diesen Wert überschreiten (wenn vorhanden). Wir finden, dass Haiti eine Menge von Hebelwirkung, aber sehr wenig tatsächlichen Einfluss hat. Lassen Sie uns die sechs einflussreichsten Länder auflisten. Ich werde dies tun, indem wir die Daten in absteigender Reihenfolge des Einflusses sortieren und dann die ersten sechs auflisten. Statas reguläre Sortierbefehle werden nur in aufsteigender Reihenfolge sortiert, aber gsort kann absteigen, wenn Sie - di angeben. Es stellt sich heraus, dass die D. R. Kuba und Ecuador sind einflussreiche Beobachtungen. Versuchen Sie, das Modell ohne die D. R. Um zu überprüfen, was ich auf Seite 57 der Vorlesungsunterlagen sage. Residuendiagramme An zu den Diagrammen Hier ist die Standardresiduendarstellung in Abbildung 2.6, die unter Verwendung der folgenden Befehle erzeugt wird: Jetzt für dieses reizende QQ-Diagramm in Abbildung 2.7 der Anmerkungen: Wasnt, dass einfach Statas qnorm das inverse normale cdf bei i (n1) Anstatt auf (i-38) (n14) oder auf einige der anderen Näherungen, die im Anhang erläutert werden. Natürlich können Sie jede Näherung, die Sie wollen, auf Kosten der Arbeit ein wenig mehr Arbeit zu verwenden. Ich werde die allgemeine Idee durch die Berechnung der Fillibens-Approximation der erwarteten Auftragsstatistik oder - klassifizierungen veranschaulichen, indem wir die statischen integrierten Systemvariablen n für die Beobachtungsnummer und N für die Anzahl der Fälle verwenden. Zum Glück stimmt die Filliben-Korrelation mit dem Wert im Anhang überein: 0 .9655. Ich überspringe die Grafik, weil sie fast identisch mit der von qnorm produziert aussieht. Kopie 2017 Germaacuten Rodriacuteguez, Princeton Universität
No comments:
Post a Comment