Do you want BuboFlash to help you learning these things? Or do you want to add or correct something? Click here to log in or create user.



Tags
#SpezielleMethoden #has-images
Question
Klassifikations- und Regressionsbäume: Überprüfung, ob der Entscheidungsbaum eine gute Klassifizierung ermöglicht

Answer
  • Baum wird aus 80% der Daten generiert (Trainingsdaten) und auf 20% der (Test)Daten angewendet
  • Wahrheitsmatrix bzw. Konfusionsmatrix
    • Häufigkeitstabelle
    • Diagonale repräsentiert Übereinstimmungen (Vorhersage = Tatsächlicher Zustand)
    • Die Werte außerhalb der Diagonale sollen möglichst klein sein (Klassifikationsfehler)
  • Abbildung:
    • Zwar werden die meisten Personen korrekt klassifiziert (Accuracy = (0+0+201+13)/304= .7039), aber der Baum ist nicht besonders nützlich
    • No Information Rate : Da der Anteil der Personen, die eher zufrieden sind, so hoch ist ((0+0+201+9)/304= .6908), würde man ähnlich gute Entscheidungen treffen, wenn man jede Person pauschal als somewhat happy“ klassifizieren würde.
  • Da die Aufteilung in Training und Test Daten zufallsbasiert ist, können jedes Mal andere Personen im Training Datensatz landen, was zu einem anderen Baum führen kann

Tags
#SpezielleMethoden #has-images
Question
Klassifikations- und Regressionsbäume: Überprüfung, ob der Entscheidungsbaum eine gute Klassifizierung ermöglicht
Answer
?

Tags
#SpezielleMethoden #has-images
Question
Klassifikations- und Regressionsbäume: Überprüfung, ob der Entscheidungsbaum eine gute Klassifizierung ermöglicht

Answer
  • Baum wird aus 80% der Daten generiert (Trainingsdaten) und auf 20% der (Test)Daten angewendet
  • Wahrheitsmatrix bzw. Konfusionsmatrix
    • Häufigkeitstabelle
    • Diagonale repräsentiert Übereinstimmungen (Vorhersage = Tatsächlicher Zustand)
    • Die Werte außerhalb der Diagonale sollen möglichst klein sein (Klassifikationsfehler)
  • Abbildung:
    • Zwar werden die meisten Personen korrekt klassifiziert (Accuracy = (0+0+201+13)/304= .7039), aber der Baum ist nicht besonders nützlich
    • No Information Rate : Da der Anteil der Personen, die eher zufrieden sind, so hoch ist ((0+0+201+9)/304= .6908), würde man ähnlich gute Entscheidungen treffen, wenn man jede Person pauschal als somewhat happy“ klassifizieren würde.
  • Da die Aufteilung in Training und Test Daten zufallsbasiert ist, können jedes Mal andere Personen im Training Datensatz landen, was zu einem anderen Baum führen kann
If you want to change selection, open document below and click on "Move attachment"

pdf

cannot see any pdfs

Summary

statusnot learnedmeasured difficulty37% [default]last interval [days]               
repetition number in this series0memorised on               scheduled repetition               
scheduled repetition interval               last repetition or drill

Details

No repetitions


Discussion

Do you want to join discussion? Click here to log in or create user.