Quindi, non dovrebbe fare alcuna differenza se mescoli o meno i dati del test o della convalida (a meno che tu non stia calcolando una metrica che dipende dall'ordine dei campioni), dato che non calcolerai alcun gradiente, ma solo la perdita o qualche metrica/misura come l'accuratezza, che non è sensibile all'ordine …
Perché i dati dovrebbero essere mischiati quando si utilizza la convalida incrociata?
it aiuta l'allenamento a convergere velocemente . evita qualsiasi distorsione durante l'allenamento. impedisce al modello di apprendere l'ordine di addestramento.
Posso mescolare il set di convalida?
Un modello viene prima addestrato su A e B combinati come set di addestramento e valutato sul set di convalida C. … La convalida incrociata funziona solo negli stessi casi in cui puoi mescolare casualmente i tuoi dati per scegliere un set di convalida.
A cosa serve il mescolamento dei dati?
Riproduzione casuale dei dati. In poche parole, le tecniche di mescolamento mirano a confondere i dati e possono facoltativamente mantenere le relazioni logiche tra le colonne. Mescola casualmente i dati da un set di dati all'interno di un attributo (ad esempio una colonna in un formato flat puro) o un insieme di attributi (ad esempio un insieme di colonne).
L'ordine dei dati è importante nell'apprendimento automatico?
L'ordine dei dati di addestramento è importante quando si addestrano le reti neurali? - Quora. È estremamente importante mescolare i dati di addestramento, in modo da non ottenere interi minibatch di esempi altamente correlati. Finchéi dati sono stati mescolati, tutto dovrebbe funzionare bene.