Dakle, ne bi trebalo da pravi nikakvu razliku da li promešate ili ne podatke testa ili validacije (osim ako ne računate neku metriku koja zavisi od redosleda uzoraka), s obzirom na to da nećete računati nikakav gradijent, već samo gubitak ili neku metriku/mjeru poput tačnosti, koja nije osjetljiva na redoslijed…
Zašto bi se podaci trebali mijenjati kada se koristi unakrsna provjera valjanosti?
to pomaže da se trening brzo konvergira . sprečava bilo kakvu pristrasnost tokom treninga. onemogućava modelu da nauči redoslijed treninga.
Mogu li nasumično promijeniti set za provjeru valjanosti?
A model se prvo obučava na A i B u kombinaciji kao skup za obuku, a evaluira se na setu za validaciju C. … Unakrsna validacija radi samo u istim slučajevima u kojima možete nasumično miješati svoje podatke kako biste odabrali set za validaciju.
Za šta se koristi miješanje podataka?
Promjena podataka. Jednostavno rečeno, tehnike miješanja imaju za cilj miješanje podataka i opciono mogu zadržati logičke odnose između stupaca. On nasumično miješa podatke iz skupa podataka unutar atributa (npr. kolona u čistom ravnom formatu) ili skupa atributa (npr. skup kolona).
Da li je poredak podataka važan u mašinskom učenju?
Da li je redosled podataka za obuku bitan kada se treniraju neuronske mreže? - Quora. Izuzetno je važno izmešati podatke o obuci, tako da ne dobijete čitave mini serije primera sa visokom korelacijom. Sve dokpodaci su promiješani, sve bi trebalo raditi OK.