Skillnad mellan klassificering och regression

Anonim

Klassificering mot regression

Klassificering och regression är lärande tekniker för att skapa modeller av förutsägelse från samlad data. Båda teknikerna presenteras grafiskt som klassificerings- och regressionsträd, eller snarare flödesdiagram med datadistribution efter varje steg, eller snarare "gren" i trädet. Denna process kallas rekursiv partitionering.

Klassificering

Klassificering är en teknik som används för att komma fram till en schematisk tabell som visar hur data ska startas med en precursorvariabel. De beroende variablerna är vilka som klassificerar data i grupper. Klassificeringsträdet börjar med den oberoende variabeln, som delas ut i två grupper som bestäms av de befintliga beroende variablerna. Det är meningen att belysa svaren i form av kategorisering som orsakas av de beroende variablerna.

Regression

Regression är en prediktionsmetod som baseras på ett antaget eller känt numeriskt utgångsvärde. Detta utgångsvärde är resultatet av en serie rekursiv partitionering, där varje steg har ett numeriskt värde och en annan grupp av beroende variabler som grenar ut till ett annat par som detta. Regressionsträdet börjar med en eller flera prekursorvariabler, och avslutas med en slutlig produktionsvariabel. De beroende variablerna är antingen kontinuerliga eller diskreta numeriska variabler.

Vad är skillnaden mellan klassificering och regression? Huvudskillnaden mellan klassificeringsträdet och regressionsträdet är deras beroende variabel. För klassificeringsträdet är de beroende variablerna kategoriska, medan regressionsträdet har numeriskt beroende variabler. De som har klassificeringsträdet har också en bestämd mängd oordnade värden, medan de i regressionsträdet har antingen diskreta men ändå beställda värden eller indiscrete värden. Ett regressions träd konstrueras med det syfte att fästa ett regressionssystem till varje determinant gren på ett sätt som det förväntade utmatningsvärdet uppkommer. Å andra sidan grenar ett klassificeringsträde som bestämt av en beroende variabel härledd från föregående nod.

Regressions- och klassificeringsträd är användbara tekniker för att kartlägga processen som pekar på ett studerat resultat, vare sig i klassificering eller ett enda numeriskt värde.

I korthet:

• Klassificeringsträd har beroende variabler som är kategoriska och oordnade.

• Regressions träd har beroende variabler som är kontinuerliga värden eller beställda hela värden.