In alcune applicazioni di autoencoder, il decoder può essere scartato dopo l'addestramento: in questi casi, l'unico scopo del decoder è addestrare l'encoder (in modo simile al ruolo del discriminatore in una rete generativa avversaria (GAN)), che viene poi utilizzato come componente di una rete neurale diversa. In molti autoencoder, il decoder continua a svolgere uno scopo dopo l'addestramento: ad esempio, nei VAE, il decoder emette nuovi campioni di dati.

Uno dei principali vantaggi dell'utilizzo degli autoencoder rispetto ad altre tecniche di dimensionalità, come l'analisi delle componenti principali (PCA), è che gli autoencoder possono acquisire complesse correlazioni non lineari. Di conseguenza, le funzioni di attivazione utilizzate negli autoencoder sono tipicamente funzioni non lineari come la funzione sigmoidea.

Diversi tipi di autoencoder apportano adattamenti a questa struttura per adattarsi meglio a compiti e tipi di dati diversi. Oltre a selezionare il tipo appropriato di rete neurale, ad esempio un'architettura basata su CNN, un'architettura basata su RNN come la long short-term memory, un'architettura trasformativa o una semplice rete neurale feed-forward, la progettazione di un autoencoder comporta molteplici iperparametri: