Toda vez que saída for categorizada: Função softmax vai dar saída como probabilidade de um input pertencer a uma classe. Função objetivo é entropia cruzada categorizada
Séries temporais com sazonalidade podem ser melhor tratadas com decomposição do que com LSTM
NLP
Imagem e áudio tem informações densas, texto é esparso
Pode se fazer CNN em NLP
Problema do Word embedding: não lida com contexto (ex: manga fruta, manga da roupa)
Google lançou Transformer (+- embedding com contexto)