
اب جی پی ٹی 4 او سے براہِ راست تصویریں بنائیں!تصاویر کی تخلیق کا نیا فیچر
ہیلو دوستوں! میں ہوں اردو اے آئی سے معراج احمد، اور آج ایک ایسی دلچسپ تکنیکی دنیا میں جہاں صرف الفاظ ہی نہیں، بلکہ تصویریں بھی مشینیں بنانے لگی ہیں۔ کیا آپ نے کبھی سوچا تھا کہ چیٹ جی پی ٹی سے بات کرتے ہوئے آپ اُسی وقت ایک مکمل تصویر بھی حاصل کر سکیں گے؟ جی ہاں، اب یہ حقیقت ہے! آئیے جانتے ہیں کہ یہ نیا فیچر “تصاویر چیٹ جی پی ٹی میں” (Images in ChatGPT) کس طرح کام کرتا ہے، اور یہ ہماری ڈیجیٹل زندگی میں کس انقلاب کا آغاز کر رہا ہے
GPT-4o “اومنی ماڈل” سے تصویروں کی تخلیق
اوپن اے آئی نے اعلان کیا ہے کہ اب چیٹ جی پی ٹی میں براہِ راست تصویریں بنائی جا سکتی ہیں۔ یہ نئی خصوصیت “تصاویر چیٹ جی پی ٹی میں” کے نام سے متعارف کروائی گئی ہے، اور یہ GPT-4o یعنی “اومنی ماڈل” پر مبنی ہے ۔ ایک ایسا ماڈل جو نہ صرف تحریر بلکہ آواز، ویڈیو اور تصویری ڈیٹا بھی بنا سکتا ہے۔ یہ فیچر چیٹ جی پی ٹی کے پلس، پرو، ٹیم، اور یہاں تک کہ فری صارفین کے لیے بھی دستیاب ہے۔ فری صارفین فی الحال ڈی اے ایل۔ای 3 کی طرح دن میں تین تصویریں بنا سکتے ہیں، تاہم یہ تعداد مستقبل میں مانگ کے مطابق بدل سکتی ہے۔
سب کے لیے دستیاب فری سے لے کر پرو تک
یہ فیچر چیٹ جی پی ٹی کے تمام صارفین کے لیے دستیاب ہے:
-
پلس (Plus)
-
پرو (Pro)
-
ٹیم (Team)
-
اور یہاں تک کہ فری (Free) صارفین بھی اس سے فائدہ اٹھا سکتے ہیں۔
فری صارفین کو ڈی اے ایل۔ای 3 کی طرز پر روزانہ تین تصویریں بنانے کی سہولت دی گئی ہے، تاہم یہ تعداد مستقبل میں صارفین کے استعمال کی بنیاد پر بدل سکتی ہے۔
نئی خصوصیات اور بہتر نتائج اب تصویر میں الفاظ بھی صاف پڑھیں!
اوپن اے آئی کے تحقیقاتی سربراہ گیبریل گوہ نے بتایا کہ GPT-4o میں ایک بڑی بہتری “بائنڈنگ” کی صلاحیت ہے، یعنی مختلف اشیاء اور ان کی خصوصیات (جیسے رنگ اور شکل) کو صحیح طریقے سے جوڑنا۔ جہاں پچھلے ماڈلز 5 سے 8 اشیاء تک ہی درست کام کرتے تھے، نیا ماڈل 15 سے 20 اشیاء کو بھی بغیر الجھن کے ظاہر کر سکتا ہے۔ ایک اور بڑی کامیابی “متن کی درستگی” ہے۔ اب تصویر پر الفاظ زیادہ واضح، بغیر غلطی کے نظر آئیں گے۔ چھوٹے سائز کے الفاظ میں ابھی بھی تھوڑا چیلنج باقی ہے، لیکن مجموعی کارکردگی بہت بہتر ہو گئی ہے۔
تصویر بنانے کا نیا طریقہ جیسے ہاتھ سے کھینچی جا رہی ہو
عام تصویری ماڈلز جیسے DALL-E مکمل تصویر ایک ساتھ بنا لیتے ہیں، جسے “ڈیفیوزن ماڈل” کہا جاتا ہے۔
مگر GPT-4o ایک نیا انداز اپناتا ہے جسے کہتے ہیں: آٹو ریگریسیو” تکنیک یہ تصویر کو بائیں سے دائیں اور اوپر سے نیچے کی طرف آہستہ آہستہ بناتا ہے۔ جیسے ہم کوئی مضمون لکھتے ہیں۔
اسی طریقے سے:
-
بہتر تفصیل
-
درست متن
-
اور زیادہ قابلِ اعتماد نتائج حاصل ہوتے ہیں۔
دلچسپ مظاہرے سائنسی خاکے سے لے کر کارٹون تک!
فیچر کے آغاز سے پہلے ٹیم نے چند زبردست مظاہرے کیے:
-
کارٹون پینلز
کردار اور مکالمے ہر فریم میں یکساں
-
معلوماتی پوسٹرز
جیسے ریسٹورینٹ مینو، اسٹیکر، یا لوگو
-
شفاف بیک گراؤنڈ تصویریں
پیشہ ورانہ ڈیزائنز کے لیے بہترین۔
یہ سب کچھ اب چیٹ جی پی ٹی میں صرف ایک جملے کے ذریعے حاصل کیا جا سکتا ہے!
حفاظتی اقدامات غلط استعمال سے بچاؤ کیسے ہوگا؟
اوپن اے آئی نے خاص طور پر اس بات کا خیال رکھا ہے کہ نیا فیچر کسی بھی غیراخلاقی، نازیبا یا خطرناک مواد کے لیے استعمال نہ ہو۔ اہم اقدامات میں شامل ہیں:
-
جنسی نوعیت کی جعلی تصاویر (deepfakes) کی روک تھام
-
CSAM (غیر قانونی تصاویر) کو بلاک کرنا
-
واٹر مارک ہٹانے کی کوششوں کو ناکام بنانا
اور ہاں، ہر تصویر میں C2PA میٹا ڈیٹا موجود ہو گا جو بتائے گا کہ یہ تصویر AI سے بنائی گئی ہے۔
ملکیت کا حق آپ کی تصویر، آپ کی مرضی!
اوپن اے آئی نے واضح کیا ہے کہ:
“چیٹ جی پی ٹی سے بنائی گئی ہر تصویر پر صارف کو مکمل حق حاصل ہے، وہ اسے جیسے چاہے استعمال کر سکتا ہے (استعمال کی پالیسی کے اندر رہتے ہوئے)۔
یعنی آپ کی تخلیق، آپ کی مرضی!
کیا یہ فن اور ٹیکنالوجی کا نیا سنگم ہے؟
تصویر بنانا ہمیشہ فنکاروں کا کام سمجھا جاتا تھا۔ لیکن اب ایک عام انسان بھی صرف ایک جملہ لکھ کر دنیا کی حسین تصویر تخلیق کر سکتا ہے۔ تو سوال یہ ہے: کیا ہم صرف مشینوں کی مدد سے تخلیق کرنے لگیں گے؟ یا انسان اور مشین کی شراکت فن کو ایک نئی بلندی پر لے جائے گی؟
No Comments