
مصنوعی ذہانت کے میدان میں گوگل کا نیا سنگِ میل جیمنی 2.5 اب نہ صرف پڑھتا اور لکھتا ہے بلکہ اب بولتا بھی ہے۔ اور وہ بھی انتہائی فطری اور جذباتی انداز میں۔ گوگل نے اپنے I/O ایونٹ میں اس ماڈل کی جدید ترین آڈیو صلاحیتوں کا مظاہرہ کیا ہے۔ یہ ماڈل ریئل ٹائم مکالمے، ملٹی اسپیکر ڈائیلاگ، متعدد زبانوں میں روانی سے گفتگو اور احساسات کی شناخت جیسے فیچرز سے لیس ہے۔
جیمنی 2.5 اب انسانی لہجے، جذبات، اور ردِعمل کو سمجھ کر بات کر سکتا ہے۔ گوگل کا کہنا ہے کہ بات چیت مستقبل میں اے آئی سے رابطے کا مرکزی ذریعہ بن جائے گی۔ اس سے پہلے جیمنی صارفین کو کچھ مسائل کا سامنا تھا جن میں جیمنی ایپ میں آڈیو اوورویو کا فیچر بند ہونے کی شکایات شامل تھیں۔ لیکن جیمنی 2.5 ان تمام تجربات کو ایک نئی سطح پر لے آیا ہے۔
آپ صرف یہ نہیں کہتے کہ کیا بولنا ہے۔ بلکہ کیسے بولنا ہے۔ یہ بھی اب آپ کے کنٹرول میں ہے۔ چاہے آواز نرم ہو، طنزیہ، یا کوئی مخصوص لہجہ ہو، جیمنی 2.5 اس سب کو نبھا سکتا ہے۔
یہ ٹیکنالوجی اب خاص طور پر ان افراد کے لیے کارآمد ہے جو اے آئی سے ویڈیو اور آڈیو پروڈکشن میں دلچسپی رکھتے ہیں۔
گوگل نے جیمنی کو اس قابل بنایا ہے کہ وہ دو افراد کی گفتگو جیسا مواد بھی تخلیق کر سکے۔ جیسے کوئی ریڈیو شو یا پوڈکاسٹ۔
یہی فیچر NotebookLM کی آڈیو اوورویوز میں بھی استعمال کیا جا رہا ہے۔ اور مستقبل میں یہ انداز ڈیجیٹل کہانی گوئی کو مزید مؤثر بنا سکتا ہے۔
جیمنی 2.5 کی سب سے نمایاں خوبی اس کی ملٹی لِنگول صلاحیت ہے۔ آپ ایک ہی جملے میں اردو اور انگریزی کو مکس کر کے بولیں یہ ماڈل سمجھ لے گا۔ اگر آپ موسیقی، نظم یا گیت کی تخلیق میں دلچسپی رکھتے ہیں تو اے آئی ماسٹر کلاس 8 میں بھی یہی موضوع تفصیل سے زیرِ بحث آیا ہے۔
گوگل کا دعویٰ ہے کہ جیمنی 2.5 میں اب نہ صرف قدرتی انداز میں آڈیو تخلیق کی جا سکتی ہے بلکہ جذباتی تاثر، رفتار، تلفظ اور لہجے پر بھی مکمل کنٹرول حاصل ہے۔
اگر آپ مفت میں آواز بنانا چاہتے ہیں تو اوپن اے آئی کی محدود وقت کی پیشکش بھی ایک اچھا موقع ثابت ہو سکتی ہے۔
گوگل نے ہر مرحلے پر ریڈ ٹیمنگ، سیفٹی اسسمنٹ اور SynthID واٹر مارکنگ جیسے اقدامات کو یقینی بنایا ہے۔ تاکہ تمام آڈیو آؤٹ پٹس کو محفوظ اور قابل شناخت رکھا جا سکے۔
ڈویلپر اب Google AI Studio یا Vertex AI کے ذریعے جیمنی 2.5 کی آڈیو فیچرز کو اپنی ایپلی کیشنز میں شامل کر سکتے ہیں۔ Flash Preview اور Pro Preview دونوں آپشنز میں دستیاب ہیں۔
یہ سب کچھ گوگل کے تفصیلی بلاگ میں بھی بیان کیا گیا ہے۔ مکمل تفصیل کے لیے یہاں ملاحظہ کریں۔
جیمنی 2.5 گوگل کی جانب سے ایک اور بڑا قدم ہے، جو انسانی آواز، جذبات، اور مکالمے کو مشینی ذہانت میں ضم کرنے کی بھرپور کوشش ہے۔
یہ ماڈل اب محض ایک AI نہیں رہا بلکہ ایک بولتا، سمجھتا اور محسوس کرتا ساتھی بن چکا ہے۔
اگر آپ جاننا چاہتے ہیں کہ یہ ماڈل گوگل کی اب تک کی سب سے ذہین اے آئی ہے یا نہیں، تو مکمل تجزیہ یہاں پڑھیں: جیمنی 2.5: اب تک کا سب سے ذہین ماڈل؟
Hi! I’m Mairaj Roonjha, a Computer Science student, Web developer, Content creator, Urdu AI blogger, and a changemaker from Lasbela, Balochistan. I’m currently studying at Lasbela University of Agriculture, Water and Marine Sciences (LUAWMS), where I focus on web development, artificial intelligence, and using tech for social good.
As the founder and lead of the Urdu AI project, I’m passionate about making artificial intelligence more accessible for Urdu-speaking communities. Through this blog, I aim to break down complex tech concepts into simple, relatable content that empowers people to learn and grow. I also work with the WALI Lab of Innovation to help reduce the digital divide in rural areas.
No Comments