অধ্যায় 16.1

নিউরন = Wx + b

Neuron as Linear Algebra

একটি নিউরন আসলে একটি dot product + activation

≈ ৮ মিনিট

"নিউরাল নেটওয়ার্ক" শব্দটি জটিল শোনালেও, একটি নিউরনের কাজ অবিশ্বাস্যভাবে সরল — input ভেক্টরের সাথে weight ভেক্টরের dot product, একটু bias যোগ, তারপর একটি non-linear ফাংশন। ব্যাস। বাকি সব এর পুনরাবৃত্তি।

একটি নিউরন

  • x — input ভেক্টর (n মাত্রা)।
  • w — weight ভেক্টর (n মাত্রা) — শেখা হয়।
  • b — bias (scalar) — শেখা হয়।
  • σ — activation function (ReLU, sigmoid, tanh, …)।

জ্যামিতিক অর্থ

  • wᵀx + b = 0 হলো একটি hyperplane।
  • Hyperplane input space-কে দুই ভাগে কাটে।
  • σ সেই বিভাজনকে "নরম" করে।
  • একটি নিউরন = একটি linear classifier।

Activation কেন দরকার

σ না থাকলে অনেক layer পরেও সব কিছু linear থেকে যায় — কারণ linear-এর composition আবার linear। Non-linear σ-ই neural net-কে শক্তিশালী করে।

  • ReLU: max(0, x) — default, দ্রুত।
  • Sigmoid: 1/(1+e⁻ˣ) — probability-এর জন্য।
  • Tanh: −1 থেকে 1।
  • GELU, SiLU: আধুনিক transformer-এ।

একটি Layer

একটি layer-এ অনেক নিউরন — সবাই একই input পায়, কিন্তু আলাদা w। সবার output একসাথে:

W একটি ম্যাট্রিক্স (out × in), b একটি ভেক্টর। σ element-wise।

মূল ভাবনা

  • 1.Neuron = wᵀx + b → σ।
  • 2.Layer = Wx + b → σ।
  • 3.Activation = non-linearity, এর ছাড়া net = linear।
  • 4.Neural net = এই সরল block-এর stack।

নিজেকে যাচাই করো

প্রশ্নে ক্লিক করে উত্তর দেখো — তবে আগে নিজে চেষ্টা করো।

প্রশ্ন 1একটি neuron-এর সমীকরণ?
উত্তর:y = σ(wᵀx + b)।
প্রশ্ন 2Activation না থাকলে?
উত্তর:পুরো net একটি linear রূপান্তরে পরিণত।
প্রশ্ন 3Layer-এ W-এর shape?
উত্তর:(out_dim × in_dim)।

ইন্টারেক্টিভ কুইজ

মূল ভাবনার উপর দ্রুত যাচাই — সঠিক বিকল্পটি বাছাই করো।

প্রশ্ন 1“নিউরন = Wx + b” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 2“নিউরন = Wx + b” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 3“নিউরন = Wx + b” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 4“নিউরন = Wx + b” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
উত্তর দেওয়া হয়েছে: 0/4