I dati di convalida devono essere mischiati?

Sommario:

I dati di convalida devono essere mischiati?
I dati di convalida devono essere mischiati?
Anonim

Quindi, non dovrebbe fare alcuna differenza se mescoli o meno i dati del test o della convalida (a meno che tu non stia calcolando una metrica che dipende dall'ordine dei campioni), dato che non calcolerai alcun gradiente, ma solo la perdita o qualche metrica/misura come l'accuratezza, che non è sensibile all'ordine …

Perché i dati dovrebbero essere mischiati quando si utilizza la convalida incrociata?

it aiuta l'allenamento a convergere velocemente . evita qualsiasi distorsione durante l'allenamento. impedisce al modello di apprendere l'ordine di addestramento.

Posso mescolare il set di convalida?

Un modello viene prima addestrato su A e B combinati come set di addestramento e valutato sul set di convalida C. … La convalida incrociata funziona solo negli stessi casi in cui puoi mescolare casualmente i tuoi dati per scegliere un set di convalida.

A cosa serve il mescolamento dei dati?

Riproduzione casuale dei dati. In poche parole, le tecniche di mescolamento mirano a confondere i dati e possono facoltativamente mantenere le relazioni logiche tra le colonne. Mescola casualmente i dati da un set di dati all'interno di un attributo (ad esempio una colonna in un formato flat puro) o un insieme di attributi (ad esempio un insieme di colonne).

L'ordine dei dati è importante nell'apprendimento automatico?

L'ordine dei dati di addestramento è importante quando si addestrano le reti neurali? - Quora. È estremamente importante mescolare i dati di addestramento, in modo da non ottenere interi minibatch di esempi altamente correlati. Finchéi dati sono stati mescolati, tutto dovrebbe funzionare bene.

Consigliato: