Effectiveness of Random Forests

Anton Kuijer

Data Scientist

Als het op machine learning aankomt dan heeft iedere data scientist wel een favoriet algoritme. Die voorkeur kan ontstaan vanwege interpreteerbaarheid en visualisatiemogelijkheden (decision tree), omdat het een bijzonder simpel model betreft (lineaire regressie) of omdat het een model is dat simpelweg in heel veel situaties goed presteert (random forests).

Random forests hebben in veel gevallen mijn voorkeur, en dit artikel bevestigt mijn mening. Naast dat RF’s snel trainen, goed werken met zowel numerical- en categorical data, geen normalisatie van variabelen vereisen en impliciet feature selection uitvoeren, zijn ze een voorbeeld van een zeer succesvolle ensemble methode. In veel kaggle competitions scoren RF’s dan ook bijzonder goed. Sterker nog, mijn hoogste kaggle notering (top 10%) heb ik ook behaald met een variant van RF’s.

Lees hier meer.

Deel dit artikel
Share on LinkedInTweet about this on TwitterShare on FacebookEmail this to someone