ٹرانسفارمر کیا ہے؟
ٹرانسفارمر (Transformer) ڈیپ لرننگ اور نیورل نیٹ ورک کی ایک خاص تعمیر ہے جو ۲۰۱۷ کے بعد زبان اور اب تصویر و آواز کی دنیا بدل گئی۔ اس سے پہلے ماڈلز الفاظ کو ایک ایک کر کے پڑھتے تھے؛ ٹرانسفارمر میں “خود توجہ” (self-attention) کی وجہ سے جملے کے تمام حصے ایک ساتھ دیکھے جاتے ہیں، اس لیے “یہ” کس چیز کی طرف اشارہ کر رہا ہے، یہ بہتر سمجھا جاتا ہے۔
یہ کیوں اہم ہے؟
آج کا لارج لینگویج ماڈل، چیٹ جی پی ٹی، جیمنی، کلاڈ — یہ سب بنیادی طور پر ٹرانسفارمر پر چلتے ہیں۔ ٹوکن کی شکل میں متن آتا ہے، ہر ٹوکن دوسرے ٹوکنز سے “توجہ” کے وزن سے جڑتا ہے، اور آخر میں اگلا لفظ یا جملہ پیشین گوئی ہوتی ہے۔
آسان تشبیہ
سوچیں آپ ایک بڑے خاندانی جلسے میں بیٹھے ہیں جہاں ہر کوئی ایک ساتھ بول رہا ہے۔ اگر آپ صرف ایک کان سے سنیں تو معنی بگڑ جائے گا۔ ٹرانسفارمر جیسے ماڈل تمام آوازوں کو ایک ساتھ وزن دے کر سنتے ہیں کہ کس بات پر کتنی توجہ دینی ہے۔ یوں لمبے اردو جملے میں بھی رشتہ درست رہتا ہے۔
پاکستان کے سیاق میں
اردو میں رسم الخط اور جملے کی ساخت مختلف ہے؛ ٹرانسفارمر والے ماڈلز بڑے ٹریننگ ڈیٹا کی بدولت اردو میں بہتر نتائج دے پاتے ہیں۔ مقامی اسٹارٹ اپس اردو وائس اسسٹنٹ یا تعلیمی بوٹس بنا رہے ہیں — ان کی بنیاد بھی یہی معماری ہے۔
متعلقہ اصطلاحات
اکثر پوچھے گئے سوالات
کیا مجھے ٹرانسفارمر کا ریاضی جاننا ضروری ہے؟ عام صارف کے لیے نہیں۔ صرف اتنا سمجھیں کہ یہ جدید چیٹ بوٹس کی “انجن کی ڈیزائن” ہے۔
کیا یہ صرف زبان کے لیے ہے؟ نہیں۔ تصویر بنانے والے ڈفیوژن ماڈل بھی اکثر ٹرانسفارمر کے حصے استعمال کرتے ہیں۔
اگلا قدم: ٹوکن سمجھیں تاکہ ماڈل متن کو اندر کیسے توڑتا ہے، واضح ہو جائے۔