ti_publica:notas_deep_learning
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Próxima revisão | Revisão anterior | ||
ti_publica:notas_deep_learning [2019/09/30 20:34] – criada cartola | ti_publica:notas_deep_learning [2019/10/01 16:08] (atual) – [Criando um vetor] cartola | ||
---|---|---|---|
Linha 2: | Linha 2: | ||
Estou estudando Deep Learning (IA) no fast.ai e guardo aqui minhas anotações. | Estou estudando Deep Learning (IA) no fast.ai e guardo aqui minhas anotações. | ||
+ | |||
+ | **Referências externas:** | ||
+ | * [[https:// | ||
+ | * Reforço matemática: | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
===== Lição 2 ===== | ===== Lição 2 ===== | ||
Linha 7: | Linha 13: | ||
==== O que pode dar errado ==== | ==== O que pode dar errado ==== | ||
- | | + | |
- | | + | - Taxa de aprendizado muito baixa; |
+ | | ||
+ | - Número de iterações muito baixo. | ||
Learning rate padrão = 0.003. Pode ser alterada em max_lr: | Learning rate padrão = 0.003. Pode ser alterada em max_lr: | ||
Linha 14: | Linha 22: | ||
**Ajustes: | **Ajustes: | ||
- | * Se sua perda no treino é maior que na validação: | + | |
+ | | ||
* Não aumente tanto o número de epochs, ou seu modelo pode ficar treinado pra reconhecer apenas a sua fotografia e não qualquer fotografia daquele tipo | * Não aumente tanto o número de epochs, ou seu modelo pode ficar treinado pra reconhecer apenas a sua fotografia e não qualquer fotografia daquele tipo | ||
+ | * O risco de treinar demais o modelo (e passar a reconhecer só suas fotos) é muito baixo. Isso pode ser percebido se seu erro caiu bem e depois começou a aumentar de novo durante as iterações | ||
+ | |||
+ | ==== Dicas lição 2 ==== | ||
+ | * Não há como definir quanto material é necessário pra um treino, só testando. Se treinar com muitas iterações e o erro começar a piorar sem antes ter chegado onde quer, e se não tiver com um dos quatro problemas mencionados, | ||
+ | * Dados desproporcionais (muito mais dados de uma das classes) também funcionam, teste. Se não funcionar uma ideia é fazer //over sampling//, copiando os dados que tem pra aumentar. | ||
+ | |||
+ | ===== Álgebra ===== | ||
+ | |||
+ | ==== Equações lineares ==== | ||
+ | |||
+ | * Notação equação reduzida da reta: y = ax + b | ||
+ | * a = coeficiente de inclinação da reta (tb chamado ' | ||
+ | * b = ponto onde a reta corta o eixo y | ||
+ | * Para operações matriciais é mais conveniente redigir como: y = ax< | ||
+ | * Mais convenientemente ainda pode ser notada assim para um conjunto de dados: {{: | ||
+ | * Notação equação fundamental da reta: '' | ||
+ | * Mais prática pra escrever a partir de m e um ponto (a,b), mas não dá a interceptação do eixo y | ||
+ | |||
+ | ===== pi torch ===== | ||
+ | |||
+ | ==== Criando um vetor==== | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * O ' | ||
+ | * Se não usar um ponto ' | ||
+ |
ti_publica/notas_deep_learning.1569875695.txt.gz · Última modificação: 2019/09/30 20:34 por cartola