Šta je Holdout set? Ponekad se naziva i podacima „testiranja“, podskup zadržavanja daje konačnu procjenu performansi modela mašinskog učenja nakon što je obučen i potvrđen. Holdout skupovi se nikada ne bi trebali koristiti za donošenje odluka o tome koje algoritme koristiti ili za poboljšanje ili podešavanje algoritama.
Je li unakrsna validacija bolja od zadržavanja?
Unakrsna validacija je obično poželjna metoda jer daje vašem modelu priliku da trenira na višestrukim testovima. Ovo vam daje bolju indikaciju o tome koliko će vaš model raditi na nevidljivim podacima. Zadržavanje, s druge strane, zavisi od samo jedne podjele testa voza.
Šta je pristup zadržavanju?
Holdout metoda je najjednostavnija vrsta metode za procjenu klasifikatora. U ovoj metodi, skup podataka (kolekcija stavki podataka ili primjera) je razdvojen u dva skupa, nazvana Training set i Test set. Klasifikator obavlja funkciju dodjeljivanja stavki podataka u datoj kolekciji ciljnoj kategoriji ili klasi.
Da li uvijek trebam raditi unakrsnu validaciju?
Uopšteno govoreći, unakrsna validacija je uvijek potrebna kada trebate odrediti optimalne parametre modela, za logističku regresiju to bi bio C parametar.
Šta je prednost K-fold unakrsne validacije?
ako uporedite test-MSE-ovi su bolji u slučaju k-puta CV-a od LOOCV-a. k-fold CV ili bilo koji CV ili metode ponovnog uzorkovanja nepoboljšati greške u testu. procjenjuju greške testa. u slučaju k-folda, radi bolji posao procjene greške od LOOCV.