ফরোয়ার্ড পাস
Forward Pass
ম্যাট্রিক্স গুণের চেইন — input থেকে prediction
≈ ৮ মিনিট
একটি deep neural network প্রকৃতপক্ষে কয়েকটি ম্যাট্রিক্স গুণ ও activation-এর চেইন। Input ঢুকিয়ে output বের করার এই প্রক্রিয়াকেই বলে forward pass — এটিই inference-এর সম্পূর্ণ গল্প।
Layer-by-layer
প্রতিটি layer-এর output পরের layer-এর input।
Batched রূপ
বাস্তবে একসাথে B-টি নমুনা প্রক্রিয়া করি — X একটি (B × in) ম্যাট্রিক্স, output Y একটি (B × out) ম্যাট্রিক্স:
GPU এই batched ম্যাট্রিক্স গুণে অসম্ভব দ্রুত।
Computational graph
- প্রতিটি অপারেশন (matmul, add, σ) একটি node।
- Edge = data flow।
- Forward pass = graph বরাবর সামনে এগোনো।
- এই graph-ই পরে backprop-এ ব্যবহৃত হয়।
Loss গণনা
ŷ পাওয়ার পর সত্য label y-এর সাথে তুলনা করে loss:
- MSE: ‖ŷ − y‖²/n — regression।
- Cross-entropy: −Σ y log ŷ — classification।
Inference vs Training
- Inference = শুধু forward pass।
- Training = forward + backward + update।
- Dropout/BatchNorm-এর আচরণ inference-এ ভিন্ন।
Layer 1: W₁ = [[1,2],[−1,1]], b₁ = [0,0]।
x = [1, 1] ⇒ z₁ = [3, 0]; a₁ = ReLU(z₁) = [3, 0]।
Layer 2: W₂ = [[1, −1]], b₂ = [2] ⇒ z₂ = 3 − 0 + 2 = 5; output 5।
মূল ভাবনা
- 1.Forward = Wx + b → σ → পরের layer।
- 2.Batched: Y = σ(XWᵀ + b)।
- 3.Computational graph backprop-এর ভিত্তি।
- 4.Inference = শুধু forward।
নিজেকে যাচাই করো
প্রশ্নে ক্লিক করে উত্তর দেখো — তবে আগে নিজে চেষ্টা করো।
প্রশ্ন 1।L-layer net-এ output কীভাবে আসে?
প্রশ্ন 2।Batched forward-এ X shape?
প্রশ্ন 3।Classification-এ loss?
প্রশ্ন 4।ReLU(−2) =?
প্রশ্ন 5।Forward pass-এর প্রতি layer-এ কাজ?
ইন্টারেক্টিভ কুইজ
মূল ভাবনার উপর দ্রুত যাচাই — সঠিক বিকল্পটি বাছাই করো।