Monday 1 May 2017

Wie Zu Sortieren Daten In Stata Forex

Ich sehe das folgende als eine Programmierübung, anstatt eine statistisch gegründete Weise, Dinge zu tun. Grundsätzlich, wie Id laufen N logistische Regressionen mit einer Prädiktor-Variable und dann für jede Variable speichern Sie den Variablennamen mit seinem chi-Quadrat-Wert. Nachdem alle Vorhersagen durchgeführt werden, möchte ich jede Prädiktorvariable anzeigen lassen, die von chi-squared vom höchsten zum niedrigsten sortiert wird. Bisher habe ich die folgenden: Wie würde ich sortieren jede Variable durch das zurückgegebene Chi-Platz in der letzten Zeile und dann die Liste der Variablen mit ihren chi-squared bestellt von höchsten chi-squared bis niedrigsten chi-squared Um klar zu sein, Wenn die folgenden varlists aus dem obigen resultiert: Dann möchte ich so etwas wie die folgenden: Es gibt eine Annahme in meiner Methode, dass die Anzahl der verwendeten Variablen ist nicht größer als die Anzahl der Beobachtungen. Wenn das falsch wäre es einige Punkt bei der Verwendung einer externen Datei, aber vermutlich die Modellierung wouldn39t dann funktionieren. Ansonsten kann ich keinen Punkt in der Verwendung einer anderen Datei sehen. Es gibt einige unangenehm, Variablen nicht mit anderen ausgerichtet. Es könnte einige Anziehungskraft bei der Verwendung von gsort zu vermeiden, die Ungeschicklichkeit der Negierung chi-Quadrat Ergebnisse und Negierung sie zurück nach der Art zu vermeiden. (Sortierung am niedrigsten zuerst.) Ndash Nick Cox 20. April um 8: 15Willkommen zum Institut für digitale Forschung und Bildung Stata-Klasse Anmerkungen Zählen von n bis N Einführung Stata hat zwei eingebaute Variablen namens n und N. N ist die Stata-Notation für die aktuelle Beobachtungsnummer. N in der ersten Beobachtung 1, 2 im zweiten, 3 im dritten und so weiter. N ist die Stata-Notation für die Gesamtzahl der Beobachtungen. Wir sehen, wie n und N arbeiten. Wie Sie sehen können, enthält die Variable id die Beobachtungsnummer, die von 1 bis 7 läuft, und nt die Gesamtzahl der Beobachtungen, die 7 ist. Zählen mit mit n und N in Verbindung mit dem Befehl kann einige sehr nützliche Ergebnisse liefern. Um den by-Befehl zu verwenden, müssen wir natürlich unsere Daten auf der by-Variablen sortieren. Nun ist n1 die Beobachtungsnummer innerhalb jeder Gruppe und n2 die Gesamtzahl der Beobachtungen für jede Gruppe. Um die niedrigste Punktzahl für jede Gruppe aufzulisten, verwenden Sie Folgendes: Um die höchste Punktzahl für jede Gruppe zu verwenden, verwenden Sie Folgendes: Eine weitere Verwendung von n Verwenden Sie n, um herauszufinden, ob es doppelte ID-Nummern in den folgenden Daten gibt: Die Beobachtungen 6 und 7 haben die gleichen Identifikationsnummern und unterschiedliche Werte. Duplikate finden Mit Hilfe von N können Sie doppelte Beobachtungen finden. In diesem Beispiel sortieren wir die Beobachtungen nach allen Variablen. Dann verwenden wir alle Variablen in der by-Anweisung und set set n gleich der Gesamtzahl der identischen Beobachtungen. Schließlich listen wir die Beobachtungen auf, für die N größer als 1 ist, wodurch die doppelten Beobachtungen identifiziert werden. Wenn Sie eine Menge von Variablen in der Datenmenge haben, könnte es lange dauern, um sie alle zweimal eingeben. Wir können die Wildcard verwenden, um anzuzeigen, dass wir alle Variablen verwenden möchten. Weiter in den neuesten Versionen von Stata können wir kombinieren Art und durch in eine einzige Aussage. Unten ist eine vereinfachte Version des Codes, die genau die gleichen Ergebnisse wie oben ergibt. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, ein Buch oder ein Softwareprodukt der Universität von Kalifornien verstanden werden.


No comments:

Post a Comment