Verschil tussen lineaire regressie en logistieke regressie

Inhoudsopgave:

Anonim

De grootste verschil tussen lineaire regressie en logistische regressie is dat de lineaire regressie wordt gebruikt om een ​​continue waarde te voorspellen, terwijl de logistische regressie wordt gebruikt om een ​​discrete waarde te voorspellen.

Machine learning-systemen kunnen toekomstige resultaten voorspellen op basis van training van eerdere inputs. Er zijn twee hoofdtypen van machine learning, onder toezicht leren en niet-gesuperviseerd leren. Regressie en classificatie vallen onder gesuperviseerd leren, terwijl clustering onder ongesuperviseerd leren valt. Algoritmen voor begeleid leren gebruiken gelabelde gegevens om de dataset te trainen. Lineaire regressie en logistische regressie zijn twee soorten begeleide leeralgoritmen. Lineaire regressie wordt gebruikt wanneer de afhankelijke variabele continu is en het model lineair is. Logistische regressie wordt gebruikt wanneer de afhankelijke variabele discreet is en het model niet-lineair is.

Lineaire regressie, logistieke regressie, machine learning

Wat is lineaire regressie?

Lineaire regressie vindt de relatie tussen onafhankelijke en afhankelijke variabelen. Beiden zijn aaneengesloten. De onafhankelijke variabele is de variabele die niet wordt gewijzigd door de andere variabelen. Het wordt aangegeven met x. Er kunnen ook meerdere onafhankelijke variabelen zijn, zoals x1, x2, x3, enz. Afhankelijke variabele verandert volgens de onafhankelijke variabele en wordt aangegeven met y.

Als er één onafhankelijke variabele is, is de regressievergelijking als volgt.

y = b0+ b1x

Neem bijvoorbeeld aan dat x de regenval voorstelt en y de gewasopbrengst.

Figuur 1: Lineaire regressie

De dataset ziet er uit zoals hierboven. Vervolgens wordt een lijn geselecteerd die de meeste gegevenspunten bedekt. Deze lijn geeft de voorspelde waarden weer.

Afbeelding 2: Afstand tussen de werkelijke gegevenspunten en de voorspelde waarden

Vervolgens wordt de afstand van elk gegevenspunt tot de lijn gevonden zoals weergegeven in de bovenstaande grafiek. Dit is de afstand tussen de werkelijke waarde en de voorspelde waarde. Deze afstand wordt ook wel de fout of residuen genoemd. De best passende lijn zou de minste som van kwadraten van fouten moeten hebben. Wanneer een nieuwe regenvalwaarde (x) wordt gegeven, is het mogelijk om de overeenkomstige gewasopbrengst (y) te vinden met behulp van deze lijn.

In de echte wereld kunnen er meerdere onafhankelijke variabelen zijn (x1, x2, x3…). Dit wordt meervoudige lineaire regressie genoemd. De meervoudige lineaire regressievergelijking is als volgt.

Wat is logistieke regressie?

Logistische regressie kan worden gebruikt om twee klassen te classificeren. Het is ook bekend als binaire classificatie. Controleren of een e-mail spam is of niet voorspellen of een klant een product zal kopen of niet, voorspellen of het mogelijk is om een ​​promotie te krijgen of niet, zijn enkele andere voorbeelden van logistieke regressie.

Figuur 3: Logistieke regressie

Neem aan dat het aantal uren dat een student per dag studeerde de onafhankelijke variabele is. Afhankelijk daarvan wordt de kans op slagen voor een examen berekend. De waarde 0,5 beschouwd als de drempel. Wanneer het nieuwe aantal uren wordt gegeven, is het mogelijk om de bijbehorende kans op het behalen van het examen te vinden met behulp van deze grafiek. Als de kans groter is dan 0,5, wordt deze beschouwd als 1 of geslaagd. Als de kans kleiner is dan 0,5, wordt deze als 0 beschouwd of mislukt.

Het toepassen van de lineaire regressievergelijking op de sigmoïde functie geeft de logistische regressievergelijking.

De sigmoïde functie is

Een ander belangrijk punt om op te merken is dat logistische regressie alleen van toepassing is om 2 klassen te classificeren. Het wordt niet gebruikt voor classificatie met meerdere klassen.

Verschil tussen lineaire regressie en logistieke regressie

Definitie

Lineaire regressie is een lineaire benadering die de relatie tussen een afhankelijke variabele en een of meer onafhankelijke variabelen modelleert. Logistische regressie daarentegen is een statistisch model dat de waarschijnlijkheid voorspelt van een uitkomst die slechts twee waarden kan hebben.

Gebruik

Terwijl lineaire regressie wordt gebruikt om regressieproblemen op te lossen, wordt logistische regressie gebruikt om classificatieproblemen op te lossen (binaire classificatie).

Methodologie

Lineaire regressie schat de afhankelijke variabele wanneer er een verandering is in de onafhankelijke variabele. Logistische regressie berekent de mogelijkheid van een gebeurtenis. Dit is een belangrijk verschil tussen lineaire regressie en logistische regressie.

Uitgangswaarde:

Ook bij lineaire regressie is de uitvoerwaarde continu. Bij logistische regressie is de uitvoerwaarde discreet.

Model

Hoewel lineaire regressie een rechte lijn gebruikt, gebruikt logistische regressie een S-curve of sigmoïde functie. Dit is een ander belangrijk verschil tussen lineaire regressie en logistische regressie.

Voorbeelden

Het voorspellen van het BBP van een land, het voorspellen van de productprijs, het voorspellen van de verkoopprijs van het huis, scorevoorspelling zijn enkele voorbeelden van lineaire regressie. Voorspellen of een e-mail spam is of niet, voorspellen of de creditcardtransactie fraude is of niet, voorspellen of een klant een lening aangaat of niet, zijn enkele voorbeelden van logistieke regressie.

Conclusie

Het verschil tussen lineaire regressie en logistische regressie is dat lineaire regressie wordt gebruikt om een ​​continue waarde te voorspellen, terwijl logistische regressie wordt gebruikt om een ​​discrete waarde te voorspellen. Kort gezegd wordt lineaire regressie gebruikt voor regressie, terwijl logistische regressie wordt gebruikt voor classificatie.

Verwijzing:

1. Lineaire regressieanalyse | Lineaire regressie in Python | Algoritmen voor machinaal leren | Simplilearn, 26 maart 2018, hier beschikbaar.2. Logistieke regressie | Logistieke regressie in Python | Algoritmen voor machinaal leren | Simplilearn, 22 maart 2018, hier beschikbaar.

Afbeelding met dank aan:

1. "Lineaire regressie" door Sewaqu - Eigen werk, publiek domein) via Commons Wikimedia2. "Residuen voor lineaire regressie-fit" door Thomas.haslwanter - Eigen werk (CC BY-SA 3.0) via Commons Wikimedia3. "Logistic-curve" door Qef (talk) - Helemaal opnieuw gemaakt met gnuplot (Public Domain) via Commons Wikimedia

Verschil tussen lineaire regressie en logistieke regressie