
اوپن اے آئی نے جی پی ٹی-4.5 اورین، اپنا اب تک کا سب سے بڑا مصنوعی ذہانت ماڈل متعارف کروا دیا
ہیلو دوستو! کیا آپ نے سنا؟ اوپن اے آئی نے جی پی ٹی-4.5 کے نام سے ایک نیا اور زبردست مصنوعی ذہانت (AI) ماڈل لانچ کر دیا ہے، جس کا کوڈ نام “اورین” ہے۔ یہ اب تک کا سب سے بڑا ماڈل ہے، جسے پہلے سے کہیں زیادہ طاقتور کمپیوٹنگ اور ڈیٹا کے ذریعے تربیت دی گئی ہے۔
لیکن ٹھہریں! کیا یہ کوئی عام اپ ڈیٹ ہے؟ نہیں، یہ ماڈل وہ سب کچھ بدلنے والا ہے جو ہم نے اب تک مصنوعی ذہانت کے بارے میں سوچا تھا۔ اوپن اے آئی کا کہنا ہے کہ جی پی ٹی-4.5 کو “فرنٹیئر ماڈل” نہیں سمجھا جا رہا، مگر اس کی قابلیت کچھ اور ہی کہانی سنا رہی ہے!
کس کو ملے گا یہ ماڈل؟
اگر آپ چیٹ جی پی ٹی پرو کے سبسکرائبر ہیں اور ہر مہینے $200 خرچ کر رہے ہیں، تو مبارک ہو! آپ آج ہی جی پی ٹی-4.5 اورین کو آزما سکتے ہیں۔ لیکن اگر آپ چیٹ جی پی ٹی پلس یا چیٹ جی پی ٹی ٹیم کے صارف ہیں، تو تھوڑا انتظار کریں، اگلے ہفتے تک یہ ماڈل آپ کے لیے بھی دستیاب ہوگا۔
کیا نیا ہے؟
یہ اورین ماڈل پہلے سے زیادہ ڈیٹا اور جدید ترین الگورتھمز کے ساتھ تیار کیا گیا ہے، جو اس میں “زیادہ گہری عالمی معلومات” اور “اعلی درجے کی جذباتی ذہانت” شامل کر چکا ہے۔ لیکن ذرا رکیں! کچھ ماہرین کا کہنا ہے کہ ڈیٹا اور کمپیوٹنگ کے اضافے کا فائدہ اب کم ہوتا جا رہا ہے، اور کچھ AI بینچ مارکس میں یہ ماڈل دیگر کمپنیوں جیسے کہ چینی AI کمپنی ڈیپ سیک، اینتھروپک، اور اوپن اے آئی کے اپنے کچھ دوسرے ماڈلز سے پیچھے رہ گیا ہے۔
قیمت اور لاگت
یہ ماڈل جتنا طاقتور ہے، اتنا ہی مہنگا بھی ہے! اگر آپ جی پی ٹی-4.5 اورین کا API استعمال کرنا چاہتے ہیں، تو ہر 10 لاکھ ان پٹ ٹوکنز (تقریباً 7,50,000 الفاظ) کے لیے $75 اور ہر 10 لاکھ آؤٹ پٹ ٹوکنز کے لیے $150 ادا کرنا ہوں گے۔ مقابلے میں جی پی ٹی-4o کی قیمت صرف $2.50 اور $10 ہے! تو کیا یہ قیمت اپنی کارکردگی ثابت کر سکے گی؟
کارکردگی کیسی رہی؟
جی پی ٹی-4.5 کی کارکردگی ملی جلی رہی ہے۔ کچھ جگہوں پر اس نے بہترین نتائج دیے، تو کچھ ٹیسٹس میں دوسرے ماڈلز سے کمزور ثابت ہوا۔
سمپل کیو اے بینچ مارک:
یہ ایک ایسا ٹیسٹ ہے جو AI ماڈلز کی فوری اور درست جوابات دینے کی صلاحیت کو جانچتا ہے۔ اس میں ماڈل کو سادہ، حقائق پر مبنی سوالات دیے جاتے ہیں۔ اور دیکھا جاتا ہے کہ آیا وہ بغیر کسی غلطی کے صحیح جواب دے سکتا ہے یا نہیں۔
مثال:
- سوال: “پاکستان کا دارالحکومت کیا ہے؟”
- درست جواب: “اسلام آباد”
اگر ماڈل زیادہ درست اور کم غلط جوابات دے، تو اس کا اسکور زیادہ ہوگا۔
اس میں جی پی ٹی-4.5 نے جی پی ٹی-4o اور دیگر ماڈلز کو پیچھے چھوڑ دیا!
SWE-Lancer (سافٹ ویئر ڈویلپمنٹ ٹیسٹ):
یہ ایک ایسا ٹیسٹ ہے جو AI ماڈلز کی سافٹ ویئر بنانے اور مکمل فیچرز تیار کرنے کی صلاحیت کو جانچتا ہے۔ اس میں AI ماڈل کو مکمل کوڈ لکھنے، سافٹ ویئر فیچر تیار کرنے اور درست طریقے سے کام کرنے والے حل فراہم کرنے کا چیلنج دیا جاتا ہے۔
مثال:
- ماڈل کو کہا جائے کہ “ایک ویب ایپلی کیشن کے لیے لاگ ان سسٹم تیار کرو”
- وہ پورا کوڈ لکھے، یوزر نیم اور پاس ورڈ ویریفیکیشن شامل کرے، اور کام کرنے والا حل فراہم کرے۔
جتنا زیادہ مؤثر، بہتر اور کم بگس (Bugs) والا کوڈ ہوگا، ماڈل کی کارکردگی اتنی ہی بہتر سمجھی جائے گی۔
اس میں بھی جی پی ٹی-4.5 شاندار کارکردگی رہی!
SWE-Bench Verified (کوڈنگ ٹیسٹ):
یہ ایک مشکل کوڈنگ بینچ مارک ہے جو AI کی بہترین پروگرامنگ صلاحیت کو جانچتا ہے۔ اس میں AI کو مشکل کوڈنگ مسائل حل کرنے دیے جاتے ہیں، جیسے کہ بگ فکسنگ (Bug Fixing)، کوڈ ریفیکٹرنگ (Refactoring)، اور پہلے سے موجود بڑے سافٹ ویئر کو بہتر بنانے کا کام دیا جاتا ہے۔
مثال:
- AI کو ایک بگ زدہ (Buggy) کوڈ دیا جائے اور کہا جائے کہ “اس میں سے خرابی ڈھونڈ کر اسے ٹھیک کرو”
- اگر ماڈل درست طریقے سے مسئلہ پہچان لے اور صحیح حل فراہم کرے، تو وہ کامیاب ہوگا۔
یہ ٹیسٹ زیادہ تکنیکی اور چیلنجنگ ہوتا ہے، اسی لیے کچھ AI ماڈلز اس میں کمزور ثابت ہو سکتے ہیں۔
یہاں جی پی ٹی-4.5 کچھ دوسرے ماڈلز کے مقابلے میں کمزور ثابت ہوا۔
حتمی بات!
اوپن اے آئی نے یہ ماڈل ایک “تحقیقی پیش نظارہ” (Research Preview) کے طور پر متعارف کرایا ہے۔ تاکہ اس کی طاقت اور کمزوریوں کو سمجھا جا سکے۔ سوال یہ ہے: کیا یہ ماڈل واقعی AI کی دنیا میں انقلاب لانے والا ہے؟ یا پھر یہ ایک اور مہنگا تجربہ ثابت ہوگا؟
یہ سب جاننے کے لیے ہمیں انتظار کرنا ہوگا کہ صارفین اس ماڈل کو کس طرح استعمال کرتے ہیں۔ آپ کا کیا خیال ہے؟ کیا آپ جی پی ٹی-4.5 کو آزمانا چاہیں گے؟ کمنٹس میں ضرور بتائیں!
No Comments