অধ্যায় 21.5

গবেষণাপত্র পড়া

Reading Research Papers

একটি বাস্তব পেপারকে গণিতের চোখে ভাঙা

≈ ১২ মিনিট

এই বইয়ের শেষ অধ্যায়। তোমার এখন প্রয়োজনীয় সব ভাষা আছে — ভেক্টর, ম্যাট্রিক্স, eigenvalue, SVD, gradient, attention, tensor। চলো একটি প্রকৃত গবেষণাপত্র খুলে দেখি — এবং দেখি, ভয় নয় — তা পড়া যায়।

একটি Paper-এর গঠন

  1. Title + Abstract — মূল দাবি এক অনুচ্ছেদে।
  2. Introduction — সমস্যা, পূর্ব কাজ, অবদান।
  3. Related Work — সাহিত্যের মানচিত্র।
  4. Method — গণিত ও algorithm এখানে।
  5. Experiments — পরীক্ষামূলক প্রমাণ।
  6. Discussion / Limitations / Conclusion।
  7. Appendix — proof, hyperparameter, ablation।

তিন-পাস কৌশল

  1. Pass 1 (১০ মিনিট): title, abstract, figure, conclusion। ‘এটা কি আমার দরকার?’ স্থির করো।
  2. Pass 2 (১ ঘণ্টা): introduction, method-এর মূল সূত্র, figure-এর caption ভালোভাবে। গণিতের detail এড়িয়ে যাও।
  3. Pass 3 (কয়েক ঘণ্টা): সব derivation কাগজে নিজে কর। কোড থাকলে চালাও।

Case Study: ‘Attention is All You Need’ (২০১৭)

এই পেপার আধুনিক AI-এর ভিত্তি। আসো এটি আমাদের গণিতে অনুবাদ করি।

  • Q, K, V — তিনটি ম্যাট্রিক্স (পর্ব ৫)। প্রতিটি token = একটি ভেক্টর (পর্ব ১)।
  • QKᵀ — dot product, similarity (পর্ব ২)।
  • √dₖ দিয়ে scaling — variance নিয়ন্ত্রণ (পর্ব ১১)।
  • Softmax — probability distribution (পর্ব ১৩)।
  • × V — weighted sum, linear combination (পর্ব ১)।
  • Multi-head — subspace-এ projection (পর্ব ১৯.৩)।
  • Residual + LayerNorm — gradient flow ও normalization (পর্ব ১৭.৩)।

Paper পড়ার Checklist

  • প্রতিটি ভেরিয়েবলের dimension কী?
  • প্রতিটি অপারেশন কোন lemma/সূত্রের উপর দাঁড়ানো?
  • Limitation কী লেখক স্বীকার করেছেন?
  • Ablation থেকে কোন উপাদান আসলে দরকার?
  • Reproducibility — কোড, dataset কি আছে?

ভালো উৎস

  • arXiv (cs.LG, cs.CV, stat.ML) — সর্বাধুনিক।
  • Papers with Code — কোডসহ পেপার।
  • Distill.pub — দৃষ্টিনন্দন ব্যাখ্যা।
  • AK / Sasha Rush / Lilian Weng — কিউরেটেড সারাংশ।
  • ‘Annotated Transformer’, ‘The Illustrated …’ সিরিজ।

নিজের পরবর্তী পদক্ষেপ

  1. একটি ছোট পেপার বেছে নাও — যেমন word2vec বা ResNet।
  2. Numpy দিয়ে এটি scratch থেকে implement করো।
  3. তোমার বন্ধুকে বুঝিয়ে বলো — শেখার সেরা পরীক্ষা।
  4. একটি ছোট সংশোধন বা প্রয়োগ লিখে blog/notebook প্রকাশ করো।
  5. প্রতি সপ্তাহে একটি পেপার পড়ার অভ্যাস গড়ো।

মূল ভাবনা

  • 1.পেপারের গঠন বোঝা = অর্ধেক যুদ্ধ।
  • 2.তিন-পাস কৌশলে সময় বাঁচে।
  • 3.প্রতিটি সূত্রকে dimension সহ পড়ো।
  • 4.Attention paper আমাদের সব পর্বকে একত্র করে।
  • 5.পড়া + implement + লেখা — শেখার চক্র।

নিজেকে যাচাই করো

প্রশ্নে ক্লিক করে উত্তর দেখো — তবে আগে নিজে চেষ্টা করো।

প্রশ্ন 1তিন-পাস কৌশলের তিনটি পর্যায়?
উত্তর:Skim → structured read → full derivation/implement।
প্রশ্ন 2Attention সূত্রে √dₖ কেন?
উত্তর:Dot product-এর variance নিয়ন্ত্রণ — softmax saturate করা থেকে বাঁচাতে।
প্রশ্ন 3পেপার সত্যিই বোঝার সেরা পরীক্ষা?
উত্তর:নিজে scratch-এ implement করা বা কাউকে বুঝিয়ে বলা।

ইন্টারেক্টিভ কুইজ

মূল ভাবনার উপর দ্রুত যাচাই — সঠিক বিকল্পটি বাছাই করো।

প্রশ্ন 1“গবেষণাপত্র পড়া” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 2“গবেষণাপত্র পড়া” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 3“গবেষণাপত্র পড়া” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 4“গবেষণাপত্র পড়া” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
উত্তর দেওয়া হয়েছে: 0/4