নিউরন = Wx + b

Neuron as Linear Algebra

একটি নিউরন আসলে একটি dot product + activation

≈ ৮ মিনিট

"নিউরাল নেটওয়ার্ক" শব্দটি জটিল শোনালেও, একটি নিউরনের কাজ অবিশ্বাস্যভাবে সরল — input ভেক্টরের সাথে weight ভেক্টরের dot product, একটু bias যোগ, তারপর একটি non-linear ফাংশন। ব্যাস। বাকি সব এর পুনরাবৃত্তি।

একটি নিউরন

y = σ (w^{T} x + b)

x — input ভেক্টর (n মাত্রা)।
w — weight ভেক্টর (n মাত্রা) — শেখা হয়।
b — bias (scalar) — শেখা হয়।
σ — activation function (ReLU, sigmoid, tanh, …)।

জ্যামিতিক অর্থ

wᵀx + b = 0 হলো একটি hyperplane।
Hyperplane input space-কে দুই ভাগে কাটে।
σ সেই বিভাজনকে "নরম" করে।
একটি নিউরন = একটি linear classifier।

Activation কেন দরকার

σ না থাকলে অনেক layer পরেও সব কিছু linear থেকে যায় — কারণ linear-এর composition আবার linear। Non-linear σ-ই neural net-কে শক্তিশালী করে।

ReLU: max(0, x) — default, দ্রুত।
Sigmoid: 1/(1+e⁻ˣ) — probability-এর জন্য।
Tanh: −1 থেকে 1।
GELU, SiLU: আধুনিক transformer-এ।

একটি Layer

একটি layer-এ অনেক নিউরন — সবাই একই input পায়, কিন্তু আলাদা w। সবার output একসাথে:

y = σ (W x + b)

W একটি ম্যাট্রিক্স (out × in), b একটি ভেক্টর। σ element-wise।

মূল ভাবনা

1.Neuron = wᵀx + b → σ।
2.Layer = Wx + b → σ।
3.Activation = non-linearity, এর ছাড়া net = linear।
4.Neural net = এই সরল block-এর stack।

নিজেকে যাচাই করো

প্রশ্নে ক্লিক করে উত্তর দেখো — তবে আগে নিজে চেষ্টা করো।

প্রশ্ন 1।একটি neuron-এর সমীকরণ?

উত্তর:y = σ(wᵀx + b)।

প্রশ্ন 2।Activation না থাকলে?

উত্তর:পুরো net একটি linear রূপান্তরে পরিণত।

প্রশ্ন 3।Layer-এ W-এর shape?

উত্তর:(out_dim × in_dim)।

ইন্টারেক্টিভ কুইজ

মূল ভাবনার উপর দ্রুত যাচাই — সঠিক বিকল্পটি বাছাই করো।

প্রশ্ন 1।“নিউরন = Wx + b” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?

প্রশ্ন 2।“নিউরন = Wx + b” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?

প্রশ্ন 3।“নিউরন = Wx + b” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?

প্রশ্ন 4।“নিউরন = Wx + b” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?

উত্তর দেওয়া হয়েছে: 0/4