Deep Learning Notes

December 8, 2024 · 1 min · CohleM

Table of Contents

Backpropagation
Loss function
Optimization
Training
Misc
Architecture Implementation
GPU
Interpretability

Backpropagation

Loss function

Optimization

Training

Misc

Matrix Visualization
SwiGLU activation- not mine, but offers best explanation

Architecture Implementation

GPU

Basic intro to GPU architecture

Interpretability

Mechanistic Interpretability