Definysje fan it Statistike Model Regression

Regression analysearret relaasjes tusken fergunnings

Regression is in data-miningtechnika dy't brûkt wurdt om in tal fan numerike wearden (ek troch kontinulearre wearden ) te foarsjen, te krijen mei in bepaalde dataset. Bygelyks kin regression brûkt wurde om de kosten foar in produkt of tsjinst te foarsjen, oanjaan fan oare fariabelen.

Regression wurdt brûkt yn meardere yndustryën foar bedriuwslibben en marketingplaning, finansjele prognoaasje, miljeu-modeling en analyze fan trends.

Regression Vs. Klassifikaasje

Regression en klassifikaasje binne data-miningtechniken dy't brûkt wurde om problemen lykas problemen te pleatsen, mar se wurde faak ferneamd. Beide wurde brûkt foar predikaasje-analyse, mar regression wurdt brûkt om in numerike of trochgeande wearde te foarsjen, wylst de klassifikaasje gegevens yn diskrete kategoryen jout.

Bygelyks, regression soe brûkt wurde om de hûs fan in hûs te bewizen op basis fan har lokaasje, fjouwerkante fuotten, priis as lêste ferkocht, de priis fan fergelykbere wenten, en oare faktoaren. Klassifikaasje soe yn oarder wêze as jo wolle hokker huzen yn kategoryen organisearje woene, lykas kuorbalke, lotgrutte of kriminaliteit.

Typen fan regressionstechniken

De ienfâldige en âldste foarm fan regression is lineêre regression dy't brûkt wurdt om in relaasje tusken twa fariabelen te skatten. Dizze technyk brûkt de wiskundige formule fan in rjochte line (y = mx + b). Op gewoane termen betsjut dit gewoan dat in relaasje tusken X en Y in ym rjochts is mei in y-grafyk mei in Y en in X-as as in pear oerlappen. Sa kinne wy ​​bygelyks leauwe dat, mei in fergrutting fan 'e befolking, de produksje fan it fiedsel op deselde tidens ferheegje - dat in sterke, lineêre relaasje tusken de twa sifers nedich is. Om dit te visualisearjen, beskôgje in grafyk wêryn't de Y-axis as populaasje fergruttet, en de X-axis treffe de produksje fan iten. As de y-wearde ferheget, soe de X-wearde om deselde tarieding ferheegje, sadat de relaasje tusken har in rigele line kin makket.

Ferfange techniken, lykas mear regression, ferwize in relaasje tusken meardere fariabelen - bygelyks is der in korrelaasje tusken ynkomsten, oplieding en wêr't ien keart te wenjen? It tafoegjen fan mear fariabelen fergruttet de kompleksiteit fan 'e predikaasje. Der binne ferskate typen fan mear regressionstechniken, lykas standert, hierarchysk, opsetich en stapkeel, elk mei in eigen applikaasje.

Op dit stuit is it wichtich om te begripen wat wy probearje (de ôfhinklike of foarferwizige fariabele) en de gegevens dy't wy brûke om de predikaasje te meitsjen (de ûnôfhinklike of predictor- fariabelen). Yn ús foarbyld wolle wy de lokaasje foarsizze wêr't men kieze te libjen (de foarsizzende fariabele) jûn ynkommens en edukaasje (sawol foar foar predictorvariablen ).