Site icon Urdu Ai

جیمنی 2.5: جدید ترین آڈیو ڈائیلاگ اور آواز کی تخلیق میں انقلاب

جیمنی 2.5: جدید ترین آڈیو ڈائیلاگ اور آواز کی تخلیق میں انقلاب

جیمنی 2.5: جدید ترین آڈیو ڈائیلاگ اورآواز کی تخلیق میں انقلاب

مصنوعی ذہانت کے میدان میں گوگل کا نیا سنگِ میل جیمنی 2.5  اب نہ صرف پڑھتا اور لکھتا ہے بلکہ اب بولتا بھی ہے۔ اور وہ بھی انتہائی فطری اور جذباتی انداز میں۔ گوگل نے اپنے I/O ایونٹ میں اس ماڈل کی جدید ترین آڈیو صلاحیتوں کا مظاہرہ کیا ہے۔ یہ ماڈل ریئل ٹائم مکالمے، ملٹی اسپیکر ڈائیلاگ، متعدد زبانوں میں روانی سے گفتگو اور احساسات کی شناخت جیسے فیچرز سے لیس ہے۔

حقیقی وقت میں آواز کا مکالمہ

جیمنی 2.5 اب انسانی لہجے، جذبات، اور ردِعمل کو سمجھ کر بات کر سکتا ہے۔ گوگل کا کہنا ہے کہ بات چیت مستقبل میں اے آئی سے رابطے کا مرکزی ذریعہ بن جائے گی۔ اس سے پہلے جیمنی صارفین کو کچھ مسائل کا سامنا تھا جن میں جیمنی ایپ میں آڈیو اوورویو کا فیچر بند ہونے کی شکایات شامل تھیں۔ لیکن جیمنی 2.5 ان تمام تجربات کو ایک نئی سطح پر لے آیا ہے۔

آواز میں انداز اور لہجے پر مکمل کنٹرول

آپ صرف یہ نہیں کہتے کہ کیا بولنا ہے۔ بلکہ کیسے بولنا ہے۔ یہ بھی اب آپ کے کنٹرول میں ہے۔ چاہے آواز نرم ہو، طنزیہ، یا کوئی مخصوص لہجہ ہو، جیمنی 2.5 اس سب کو نبھا سکتا ہے۔
یہ ٹیکنالوجی اب خاص طور پر ان افراد کے لیے کارآمد ہے جو اے آئی سے ویڈیو اور آڈیو پروڈکشن میں دلچسپی رکھتے ہیں۔

ملٹی اسپیکر آڈیو ڈائیلاگ اور کہانی گوئی

گوگل نے جیمنی کو اس قابل بنایا ہے کہ وہ دو افراد کی گفتگو جیسا مواد بھی تخلیق کر سکے۔ جیسے کوئی ریڈیو شو یا پوڈکاسٹ۔
یہی فیچر NotebookLM کی آڈیو اوورویوز میں بھی استعمال کیا جا رہا ہے۔ اور مستقبل میں یہ انداز ڈیجیٹل کہانی گوئی کو مزید مؤثر بنا سکتا ہے۔

24 سے زائد زبانوں میں رواں گفتگو

جیمنی 2.5 کی سب سے نمایاں خوبی اس کی ملٹی لِنگول صلاحیت ہے۔ آپ ایک ہی جملے میں اردو اور انگریزی کو مکس کر کے بولیں  یہ ماڈل سمجھ لے گا۔ اگر آپ موسیقی، نظم یا گیت کی تخلیق میں دلچسپی رکھتے ہیں تو اے آئی ماسٹر کلاس 8 میں بھی یہی موضوع تفصیل سے زیرِ بحث آیا ہے۔

ٹیکسٹ ٹو اسپیچ میں بے مثال کنٹرول

گوگل کا دعویٰ ہے کہ جیمنی 2.5 میں اب نہ صرف قدرتی انداز میں آڈیو تخلیق کی جا سکتی ہے بلکہ جذباتی تاثر، رفتار، تلفظ اور لہجے پر بھی مکمل کنٹرول حاصل ہے۔
اگر آپ مفت میں آواز بنانا چاہتے ہیں تو اوپن اے آئی کی محدود وقت کی پیشکش بھی ایک اچھا موقع ثابت ہو سکتی ہے۔

ذمہ داری اور تحفظ

گوگل نے ہر مرحلے پر ریڈ ٹیمنگ، سیفٹی اسسمنٹ اور SynthID واٹر مارکنگ جیسے اقدامات کو یقینی بنایا ہے۔ تاکہ تمام آڈیو آؤٹ پٹس کو محفوظ اور قابل شناخت رکھا جا سکے۔

ڈویلپرز کے لیے آڈیو کی نئی دنیا

ڈویلپر اب Google AI Studio یا Vertex AI کے ذریعے جیمنی 2.5 کی آڈیو فیچرز کو اپنی ایپلی کیشنز میں شامل کر سکتے ہیں۔ Flash Preview اور Pro Preview دونوں آپشنز میں دستیاب ہیں۔
یہ سب کچھ گوگل کے تفصیلی بلاگ میں بھی بیان کیا گیا ہے۔ مکمل تفصیل کے لیے یہاں ملاحظہ کریں۔

 آواز کا نیا دور

جیمنی 2.5 گوگل کی جانب سے ایک اور بڑا قدم ہے، جو انسانی آواز، جذبات، اور مکالمے کو مشینی ذہانت میں ضم کرنے کی بھرپور کوشش ہے۔
یہ ماڈل اب محض ایک AI نہیں رہا  بلکہ ایک بولتا، سمجھتا اور محسوس کرتا ساتھی بن چکا ہے۔

اگر آپ جاننا چاہتے ہیں کہ یہ ماڈل گوگل کی اب تک کی سب سے ذہین اے آئی ہے یا نہیں، تو مکمل تجزیہ یہاں پڑھیں: جیمنی 2.5: اب تک کا سب سے ذہین ماڈل؟

Exit mobile version