fbpx

Google I/O 2024: Gemini 1.5 Pro improvements, new 1.5 Flash model and new Gemma models announced


Google I/O 2024: Gemini 1.5 Pro improvements, new 1.5 Flash model and new Gemma models announced

Google I/O 2024 इवेंट में, Google ने उपयोगकर्ता अनुभव को बेहतर बनाने और डेवलपर्स के लिए नए टूल प्रदान करने पर ध्यान केंद्रित करते हुए उत्पाद में कई अपडेट और परिवर्धन का अनावरण किया। जो घोषणा की गई उसका सारांश इस प्रकार है।

जेमिनी 1.5 प्रो और 1.5 फ्लैश

जेमिनी 1.5 प्रो अनुवाद और कोडिंग जैसे विभिन्न कार्यों में गुणवत्ता में महत्वपूर्ण सुधार प्रदान करता है। इन सुधारों का लक्ष्य उपयोगकर्ताओं को व्यापक श्रेणी के जटिल कार्यों को प्रभावी ढंग से संभालने में सक्षम बनाना है।

इस बीच, जेमिनी 1.5 फ़्लैश का अनुकूलित डिज़ाइन इसे उन कार्यों के लिए आदर्श बनाता है जिनके लिए तेज़ प्रतिक्रिया की आवश्यकता होती है। दोनों मॉडल मूल रूप से मल्टी-मोड कार्यक्षमता का समर्थन करते हैं, जिससे उपयोगकर्ता टेक्स्ट, छवियों, ऑडियो और वीडियो को सहजता से एकीकृत कर सकते हैं।

मानक संस्करण 1 मिलियन टोकन संदर्भ विंडो प्रदान करता है, लेकिन उपयोगकर्ता Google क्लाउड ग्राहकों के लिए Google AI स्टूडियो या वर्टेक्स AI की प्रतीक्षा सूची में शामिल होकर 2 मिलियन टोकन विंडो तक पहुंच सकते हैं।

प्रभावशीलता: दोनों मॉडलों के पूर्वावलोकन संस्करण वर्तमान में 200 से अधिक देशों और क्षेत्रों में उपलब्ध हैं, जिनकी सामान्य रिलीज़ जून के लिए निर्धारित है।

नई डेवलपर सुविधाएँ

उपयोगकर्ता की प्रतिक्रिया के आधार पर, Google जेमिनी एपीआई में दो नई सुविधाएँ पेश कर रहा है: अधिक कुशल प्रसंस्करण को सक्षम करने के लिए वीडियो फ्रेम निष्कर्षण और समानांतर फ़ंक्शन कॉल।

जून में, Google ने जेमिनी 1.5 प्रो के लिए संदर्भ कैशिंग लागू करने की योजना बनाई है, जिससे मॉडल में बार-बार संकेतों और बड़ी फ़ाइलों को फिर से भेजने की आवश्यकता को कम करके दक्षता और सामर्थ्य में सुधार होगा।

कीमत: Google AI स्टूडियो के माध्यम से पात्र क्षेत्रों में जेमिनी एपीआई तक पहुंच निःशुल्क रहेगी, लेकिन Google अधिक उपयोग को समायोजित करने के लिए अपनी भुगतान-एज़-यू-गो सेवा का विस्तार कर रहा है, दर सीमा बढ़ा रहा है।

जेम्मा परिवार में जोड़ें

पालीगेम्मा, Google का पहला विज़न लैंग्वेज ओपन मॉडल, मौजूदा जेम्मा वेरिएंट कोडजेम्मा और रिकरंटजेम्मा में शामिल होकर, इमेज कैप्शनिंग और विज़ुअल क्यू एंड ए जैसे कार्यों के लिए अनुकूलित किया गया है।

  • जून में रिलीज के लिए निर्धारित, जेम्मा 2, जेम्मा मॉडल की अगली पीढ़ी का प्रतिनिधित्व करता है, जो डेवलपर-अनुकूल आकार में उद्योग-अग्रणी प्रदर्शन प्रदान करता है।
  • आकार और प्रदर्शन को संतुलित करने के लिए विशेष रूप से डिज़ाइन किया गया, जेम्मा 27बी मॉडल जीपीयू और टीपीयू के साथ संगतता बनाए रखते हुए बड़े मॉडलों की दक्षता को पार करता है।

जेमिनी एपीआई डेवलपर प्रतियोगिता

डेवलपर्स को अपनी रचनात्मकता दिखाने के लिए प्रोत्साहित करने के लिए Google ने पहली जेमिनी एपीआई डेवलपर प्रतियोगिता शुरू की। सबमिशन की अंतिम तिथि 12 अगस्त है और भव्य पुरस्कार एक कस्टम इलेक्ट्रिक डेलोरियन है।

जेमिनी 1.5 प्रो अपडेट

Google I/O 2024 में, Google ने जेमिनी 1.5 प्रो में कई अपडेट पेश किए, जिसमें एक लंबी संदर्भ विंडो, बेहतर डेटा विश्लेषण सुविधाएं और Google ऐप्स के साथ बेहतर एकीकरण शामिल है।

एक लंबी संदर्भ विंडो का उपयोग करके दस्तावेज़ों का विश्लेषण करें

जेमिनी 1.5 प्रो, जेमिनी एडवांस्ड का हिस्सा, अब 10 लाख टोकन की एक संदर्भ विंडो का समर्थन करता है, जो किसी भी उपभोक्ता चैटबॉट की सबसे लंबी अवधि है।

यह आपको 1,500 पृष्ठों तक के बड़े दस्तावेज़ों को संसाधित करने या 100 ईमेल को सारांशित करने की अनुमति देता है। आप जल्द ही एक घंटे लंबे वीडियो या 30,000 से अधिक लाइनों के कोडबेस को संसाधित करेंगे।

उपयोगकर्ता Google ड्राइव के माध्यम से या सीधे जेमिनी एडवांस्ड में फ़ाइलें अपलोड कर सकते हैं, जिससे लीज़ समझौतों या शोध पत्रों जैसे सघन दस्तावेज़ों से अंतर्दृष्टि निकालना आसान हो जाता है।

जेमिनी जल्द ही स्प्रेडशीट में कस्टम विज़ुअलाइज़ेशन बनाने के लिए डेटा फ़ाइलों का विश्लेषण करने में भी सक्षम होगी। सभी फ़ाइलें निजी रखी जाती हैं और मॉडलों को प्रशिक्षित करने के लिए उनका उपयोग नहीं किया जाता है।

जेमिनी 1.5 प्रो छवि समझ में भी सुधार करता है। उपयोगकर्ता रेसिपी प्राप्त करने के लिए किसी व्यंजन की तस्वीर खींच सकते हैं या चरण-दर-चरण समाधान प्राप्त करने के लिए गणित की समस्या खींच सकते हैं।

प्रभावशीलता: जेमिनी 1.5 प्रो जेमिनी एडवांस्ड ग्राहकों के लिए 150 से अधिक देशों और 35 भाषाओं में उपलब्ध है।

जेमिनी लाइव के साथ स्वाभाविक बातचीत

जेमिनी लाइव उपयोगकर्ताओं को टेक्स्ट या आवाज के माध्यम से चैट करने की अनुमति देकर बातचीत को बढ़ाता है। Google Messages में यूजर्स सीधे जेमिनी से चैट कर सकते हैं। जेमिनी लाइव उपयोगकर्ताओं को विभिन्न प्रकार की प्राकृतिक आवाज़ों में से चुनने, अपनी गति से बोलने और स्पष्टीकरण के लिए रुकने की अनुमति देता है।

उदाहरण के लिए, उपयोगकर्ता जेमिनी के साथ अभ्यास करके नौकरी के लिए साक्षात्कार की तैयारी कर सकते हैं, जो उजागर करने के लिए कौशल सुझा सकते हैं। इस वर्ष के अंत में, उपयोगकर्ता अधिक इंटरैक्टिव बातचीत करने के लिए लाइव सत्र के दौरान अपने कैमरे का उपयोग करने में सक्षम होंगे।

प्रभावशीलता: जेमिनी लाइव आने वाले महीनों में जेमिनी एडवांस्ड ग्राहकों के लिए शुरू किया जाएगा।

सरलीकृत यात्रा योजना

जेमिनी एडवांस्ड अब अनुकूलित यात्रा कार्यक्रम बनाने के लिए एक योजना सुविधा प्रदान करता है। उपयोगकर्ता जीमेल से उड़ान और होटल की जानकारी प्राप्त करके, भोजन की प्राथमिकताओं को ध्यान में रखकर और स्थानीय गतिविधियों का सुझाव देकर जेमिनी से अपनी यात्रा की योजना बनाने के लिए कह सकते हैं।

उदाहरण के लिए, मियामी की यात्रा के बारे में एक संदेश एक यात्रा कार्यक्रम उत्पन्न कर सकता है जिसमें उड़ान विवरण, रेस्तरां सिफारिशें, संग्रहालय दौरे और बहुत कुछ शामिल है। यदि कोई परिवर्तन या अतिरिक्त विवरण हैं तो आपका यात्रा कार्यक्रम स्वचालित रूप से अपडेट हो जाएगा।

प्रभावशीलता: यह प्लान सुविधा जल्द ही जेमिनी एडवांस्ड ग्राहकों के लिए उपलब्ध होगी।

अपने मिथुन राशि वालों को गहनों से निजीकृत करें

जेमिनी एडवांस्ड सब्सक्राइबर जल्द ही विशिष्ट कार्यों के लिए जेम्स, जेमिनी के कस्टम संस्करण बनाने में सक्षम होंगे: जिम बडी, कुकिंग असिस्टेंट, कोडिंग पार्टनर, राइटिंग गाइड, और बहुत कुछ। उपयोगकर्ता अपनी वांछित भूमिकाओं और व्यवहारों का वर्णन करते हैं, और जेमिनी तदनुसार रत्न बनाता है।

अधिक Google Apps के साथ एकीकरण

जेमिनी Google कैलेंडर, टास्क और कीप सहित अधिक Google टूल से जुड़ता है। यह उपयोगकर्ताओं को स्कूल पाठ्यक्रम फ़ोटो से कैलेंडर प्रविष्टियाँ बनाने या रेसिपी फ़ोटो को खरीदारी सूचियों में परिवर्तित करने जैसे कार्यों को स्वचालित करने की अनुमति देता है।

जेमिनी मॉडल अपडेट

  • 1.5 फ्लैश पेश किया गया है, जो गति और दक्षता के लिए अनुकूलित है। यह 1.5 प्रो से हल्का है, लेकिन सारांश, चैट एप्लिकेशन और दस्तावेज़ों से डेटा निकालने जैसे कार्यों में उत्कृष्टता प्राप्त करता है।

  • 1.5 प्रो विभिन्न प्रकार के कार्यों में बेहतर प्रदर्शन के साथ महत्वपूर्ण सुधार प्रदान करता है, जिसमें कोड जनरेशन, तार्किक तर्क, ऑडियो समझ और बहुत कुछ शामिल हैं।

  • जेमिनी नैनो अब टेक्स्ट, इमेज, ध्वनि और बोली जाने वाली भाषा सहित मल्टीमॉडल इनपुट को समझती है।

जेम्मा परिवार अद्यतन

  • जेम्मा 2: गूगल ने अपने अगली पीढ़ी के ओपन मॉडल जेम्मा 2 को एक नए आकार में लॉन्च किया है, जिसे शानदार प्रदर्शन और दक्षता के लिए डिज़ाइन किया गया है।
  • पालीजेम्मा: जेम्मा परिवार पालीजेम्मा के साथ विस्तारित है, जो PaLI-3 से प्रेरित पहला विज़न भाषा मॉडल है।
  • जिम्मेदार जेनरेटिव एआई टूलकिट: मॉडल प्रतिक्रिया गुणवत्ता का मूल्यांकन करने के लिए एलएलएम तुलनित्र में अपग्रेड किया गया।
प्रोजेक्ट एस्ट्रा प्रगति पर है

Google ने प्रोजेक्ट एस्ट्रा पर प्रगति साझा की, जिसका उद्देश्य रोजमर्रा के समर्थन के लिए सामान्य-उद्देश्यीय एआई एजेंटों को विकसित करना है।

इन एजेंटों का लक्ष्य इंसानों की तरह दुनिया को समझना और प्रतिक्रिया देना और सक्रिय, शिक्षण योग्य और व्यक्तिगत रूप से कार्य करना है। Google इंटरैक्शन की गुणवत्ता और गति बढ़ाने के लिए धारणा, तर्क और बातचीत को बेहतर बनाने के लिए काम कर रहा है।

Google ने जेमिनी मॉडल के माध्यम से नवाचार की अपनी निरंतर खोज पर जोर दिया, रोमांचक उपयोग के मामलों की खोज करते हुए नए विचारों की खोज की।

Leave a Comment