অধ্যায় 19.R

পর্ব 19 পুনরালোচনা — এলএলএম গণিত

Part 19 Review — এলএলএম গণিত

সারসংক্ষেপ + ১০টি মিশ্র সমস্যা

≈ ১৫ মিনিট

পুরো পর্বের মূল বার্তা এক জায়গায় — তারপর হাত মকশো করার ১০টি সমস্যা।

মূল ধারণাগুলো এক নজরে

  • Word → embedding vector ∈ ℝᵈ।
  • Attention = softmax(QKᵀ/√dₖ) V।
  • Multi-head = h parallel attention, concat।
  • Transformer block = attention + FFN + residual + LayerNorm।
  • Positional encoding sequence-এ order ফেরায়।

সমন্বিত worked example

উদাহরণ
সমন্বিত উদাহরণ — attention scaling

Q, K ∈ ℝ^{n × dₖ} যেখানে dₖ = 64।

Score = QKᵀ ∈ ℝ^{n × n}।

Scale = score / √64 = score / 8।

Softmax(row-wise) → attention weights → output = (weights) · V।

মূল ভাবনা

  • 1.Word → embedding vector ∈ ℝᵈ।
  • 2.Attention = softmax(QKᵀ/√dₖ) V।
  • 3.Multi-head = h parallel attention, concat।
  • 4.Transformer block = attention + FFN + residual + LayerNorm।
  • 5.Positional encoding sequence-এ order ফেরায়।

নিজেকে যাচাই করো

প্রশ্নে ক্লিক করে উত্তর দেখো — তবে আগে নিজে চেষ্টা করো।

প্রশ্ন 1Self-attention input?
উত্তর:Q, K, V — সবই X থেকে।
প্রশ্ন 2√dₖ কেন?
উত্তর:Variance নিয়ন্ত্রণ।
প্রশ্ন 3Softmax কাজ?
উত্তর:Row → probability।
প্রশ্ন 4Multi-head কেন?
উত্তর:একাধিক subspace দৃষ্টি।
প্রশ্ন 5Causal mask কী?
উত্তর:Future token দেখা বন্ধ।
প্রশ্ন 6Transformer-এ residual?
উত্তর:Gradient flow সহায়ক।
প্রশ্ন 7LayerNorm কাজ?
উত্তর:Activation স্থিতিশীল।
প্রশ্ন 8FFN কী?
উত্তর:Position-wise MLP।
প্রশ্ন 9Embedding dim d সাধারণত?
উত্তর:512/768/1024…
প্রশ্ন 10Positional encoding-এর প্রয়োজন?
উত্তর:Order বহন।

ইন্টারেক্টিভ কুইজ

মূল ভাবনার উপর দ্রুত যাচাই — সঠিক বিকল্পটি বাছাই করো।

প্রশ্ন 1“পর্ব 19 পুনরালোচনা — এলএলএম গণিত” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 2“পর্ব 19 পুনরালোচনা — এলএলএম গণিত” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 3“পর্ব 19 পুনরালোচনা — এলএলএম গণিত” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
প্রশ্ন 4“পর্ব 19 পুনরালোচনা — এলএলএম গণিত” অধ্যায়ের মূল ভাবনাগুলোর মধ্যে নিচের কোনটি অন্তর্ভুক্ত?
উত্তর দেওয়া হয়েছে: 0/4