অধ্যায় 21.3

ম্যানিফোল্ড লার্নিং

Manifold Learning

উচ্চমাত্রিক ডেটার ভিতরে লুকানো বাঁকানো পৃষ্ঠ

≈ ১১ মিনিট

তোমার ডেটা হয়তো ১০০০ dimension-এ আছে, কিন্তু আসলে ২-৩টি অর্থবহ অক্ষ আছে — বাকিটা শব্দ বা পুনরাবৃত্তি। Manifold hypothesis: বাস্তব ডেটা একটি নিচু-মাত্রিক বাঁকানো পৃষ্ঠে বাস করে।

Manifold কী?

Manifold = একটি স্থান যা প্রতিটি বিন্দুর কাছে সমতল (Euclidean) দেখায়, কিন্তু পুরো scale-এ বাঁকানো হতে পারে। পৃথিবীর পৃষ্ঠ — প্রতিটি ছোট অংশ সমতল মনে হয়, কিন্তু পৃথিবী গোলক।

PCA-এর সীমা

PCA = linear manifold (subspace) ধরে। কিন্তু ডেটা যদি একটি Swiss roll-এর মতো বাঁকানো থাকে, PCA তাকে সমতল করতে পারে না — Euclidean দূরত্ব ভুল উত্তর দেয়।

Geodesic Distance

Manifold-এ দুটি বিন্দুর প্রকৃত দূরত্ব = পৃষ্ঠ বরাবর সবচেয়ে ছোট পথ (geodesic), straight line নয়। পৃথিবীতে ঢাকা থেকে নিউইয়র্ক — সরলরেখা পৃথিবীর ভিতর দিয়ে যাবে; geodesic = great circle।

ক্লাসিক্যাল অ্যালগরিদম

  • Isomap: k-NN graph → graph-এ shortest path = geodesic → classical MDS।
  • LLE (Locally Linear Embedding): প্রতিটি বিন্দু = প্রতিবেশীর linear combination, কম-dimension-এ সংরক্ষণ।
  • Laplacian Eigenmaps: graph Laplacian-এর smallest eigenvector।
  • Diffusion Maps: random walk-এর transition matrix-এর eigenstructure।
  • t-SNE: high-D ও low-D distribution-এর KL divergence কমানো — visualization-এর রাজা।
  • UMAP: topological data analysis থেকে অনুপ্রাণিত, t-SNE-র চেয়ে দ্রুত।

Spectral Graph Theory-এর ভূমিকা

অধিকাংশ manifold পদ্ধতি একটি graph তৈরি করে এবং তার Laplacian L = D − W-এর eigendecomposition করে। ছোট eigenvalue → মসৃণ embedding। লিনিয়ার অ্যালজেব্রা এখানেও।

Laplacian eigenvalue = manifold-এর scale-গুলি।

Deep Learning-এর সাথে সম্পর্ক

  • Autoencoder = শেখা nonlinear manifold।
  • VAE = একটি probability distribution latent manifold-এ।
  • Diffusion model: ডেটা manifold-এ ফেরার পথ শেখে।
  • Representation learning-এর গভীর লক্ষ্য — manifold আবিষ্কার করা।

মূল ভাবনা

  • 1.বাস্তব ডেটা প্রায়ই কম-মাত্রিক manifold-এ থাকে।
  • 2.Geodesic distance ≠ Euclidean distance।
  • 3.Isomap, LLE, Laplacian Eigenmaps — graph + eigenvalue।
  • 4.t-SNE/UMAP visualization-এর জন্য কার্যকর।
  • 5.Autoencoder, VAE, Diffusion — manifold-শেখার নিউরাল রূপ।

নিজেকে যাচাই করো

প্রশ্নে ক্লিক করে উত্তর দেখো — তবে আগে নিজে চেষ্টা করো।

প্রশ্ন 1Manifold hypothesis কী বলে?
উত্তর:উচ্চমাত্রিক বাস্তব ডেটা অনেক কম-মাত্রিক একটি (বাঁকানো) manifold-এ থাকে।
প্রশ্ন 2PCA কেন Swiss roll unwrap করতে পারে না?
উত্তর:PCA linear; Swiss roll-এর geodesic-গুলি বাঁকানো — linear projection ভাঁজ ভাঙে না।
প্রশ্ন 3t-SNE আর UMAP-এর মূল লক্ষ্য?
উত্তর:Local neighborhood structure সংরক্ষণ করে কম dimension-এ visualization।

ইন্টারেক্টিভ কুইজ

মূল ভাবনার উপর দ্রুত যাচাই — সঠিক বিকল্পটি বাছাই করো।

প্রশ্ন 1“ম্যানিফোল্ড লার্নিং” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 2“ম্যানিফোল্ড লার্নিং” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 3“ম্যানিফোল্ড লার্নিং” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 4“ম্যানিফোল্ড লার্নিং” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
উত্তর দেওয়া হয়েছে: 0/4