← পাঠ্যসূচি
100%
অধ্যায় 16.1
নিউরন = Wx + b
Neuron as Linear Algebra
একটি নিউরন আসলে একটি dot product + activation
≈ ৮ মিনিট
"নিউরাল নেটওয়ার্ক" শব্দটি জটিল শোনালেও, একটি নিউরনের কাজ অবিশ্বাস্যভাবে সরল — input ভেক্টরের সাথে weight ভেক্টরের dot product, একটু bias যোগ, তারপর একটি non-linear ফাংশন। ব্যাস। বাকি সব এর পুনরাবৃত্তি।
একটি নিউরন
- x — input ভেক্টর (n মাত্রা)।
- w — weight ভেক্টর (n মাত্রা) — শেখা হয়।
- b — bias (scalar) — শেখা হয়।
- σ — activation function (ReLU, sigmoid, tanh, …)।
জ্যামিতিক অর্থ
- wᵀx + b = 0 হলো একটি hyperplane।
- Hyperplane input space-কে দুই ভাগে কাটে।
- σ সেই বিভাজনকে "নরম" করে।
- একটি নিউরন = একটি linear classifier।
Activation কেন দরকার
σ না থাকলে অনেক layer পরেও সব কিছু linear থেকে যায় — কারণ linear-এর composition আবার linear। Non-linear σ-ই neural net-কে শক্তিশালী করে।
- ReLU: max(0, x) — default, দ্রুত।
- Sigmoid: 1/(1+e⁻ˣ) — probability-এর জন্য।
- Tanh: −1 থেকে 1।
- GELU, SiLU: আধুনিক transformer-এ।
একটি Layer
একটি layer-এ অনেক নিউরন — সবাই একই input পায়, কিন্তু আলাদা w। সবার output একসাথে:
W একটি ম্যাট্রিক্স (out × in), b একটি ভেক্টর। σ element-wise।
মূল ভাবনা
- 1.Neuron = wᵀx + b → σ।
- 2.Layer = Wx + b → σ।
- 3.Activation = non-linearity, এর ছাড়া net = linear।
- 4.Neural net = এই সরল block-এর stack।
নিজেকে যাচাই করো
প্রশ্নে ক্লিক করে উত্তর দেখো — তবে আগে নিজে চেষ্টা করো।
প্রশ্ন 1।একটি neuron-এর সমীকরণ?
উত্তর:y = σ(wᵀx + b)।
প্রশ্ন 2।Activation না থাকলে?
উত্তর:পুরো net একটি linear রূপান্তরে পরিণত।
প্রশ্ন 3।Layer-এ W-এর shape?
উত্তর:(out_dim × in_dim)।
ইন্টারেক্টিভ কুইজ
মূল ভাবনার উপর দ্রুত যাচাই — সঠিক বিকল্পটি বাছাই করো।
প্রশ্ন 1।“নিউরন = Wx + b” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 2।“নিউরন = Wx + b” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 3।“নিউরন = Wx + b” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 4।“নিউরন = Wx + b” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
উত্তর দেওয়া হয়েছে: 0/4