ছবি = ম্যাট্রিক্স
Images as Matrices
প্রতিটি ছবি সংখ্যার গ্রিড
≈ ৮ মিনিট
তোমার ফোনের প্রতিটি ছবি — আসলে সংখ্যার একটি গ্রিড। ১০৮০×১৯২০ মানে ২০ লক্ষ pixel, প্রতিটি ০–২৫৫ সংখ্যা। Computer vision-এর সব জাদু এই সংখ্যার গ্রিড-এর উপর গণিত।
Grayscale ছবি
H×W ম্যাট্রিক্স, প্রতিটি entry ০ (কালো) থেকে ২৫৫ (সাদা)। বা normalize করে [0, 1]।
RGB ছবি
- তিনটি channel: Red, Green, Blue।
- Shape: H × W × 3।
- প্রতিটি pixel-এর তিনটি সংখ্যা — সেই রঙের mix।
অন্যান্য colour space
- Grayscale: 0.299R + 0.587G + 0.114B (চোখের sensitivity)।
- HSV: Hue, Saturation, Value — মানুষের রঙবোধের কাছাকাছি।
- YCbCr: Luminance + chrominance — JPEG compression-এ।
- Lab: device-independent।
মৌলিক অপারেশন
- Brightness: I + c।
- Contrast: αI + β।
- Negative: 255 − I।
- Threshold: I > t ? 255 : 0।
- Channel swap: RGB → BGR।
Histogram
প্রতিটি intensity মান কতবার এসেছে তার গণনা। Histogram equalization → contrast বাড়ায়।
একটি neuron-এর ইনপুট x = (x₁, x₂, x₃), ওজন w = (w₁, w₂, w₃), bias b।
Pre-activation: z = w·x + b = wᵀx + b — একটি ডট প্রোডাক্ট।
৪টি neuron মিলে একটি স্তর হলে ওজনগুলো একটি 4×3 ম্যাট্রিক্স W গঠন করে।
Layer-এর আউটপুট: z = Wx + b, তারপর a = σ(z) (যেমন ReLU)।
Batch (N নমুনা একসাথে) হলে: Z = XWᵀ + b — পুরো batch-এ একটি ম্যাট্রিক্স গুণ।
মূল ভাবনা
- 1.Grayscale = H×W matrix; RGB = H×W×3 tensor।
- 2.Pixel value সাধারণত ০–২৫৫ বা [0,1]।
- 3.Colour space-এর পছন্দ task-নির্ভর।
- 4.Image processing = matrix function।
নিজেকে যাচাই করো
প্রশ্নে ক্লিক করে উত্তর দেখো — তবে আগে নিজে চেষ্টা করো।
প্রশ্ন 1।1080p RGB ছবি-তে কত সংখ্যা?
প্রশ্ন 2।Negative image কীভাবে?
প্রশ্ন 3।JPEG কোন colour space-এ?
প্রশ্ন 4।MLP-র forward pass-এ প্রধান লিনিয়ার অপারেশন কী?
প্রশ্ন 5।যদি activation σ identity হয়, ৫-স্তরের MLP কী?
ইন্টারেক্টিভ কুইজ
মূল ভাবনার উপর দ্রুত যাচাই — সঠিক বিকল্পটি বাছাই করো।