World of Tech This Week – Grok 2 has Flux, Gemini Live voice companion, Fully generated AI Ads, Dancing Robots and more!


World of Tech This Week – Grok 2 has Flux, Gemini Live voice companion, Fully generated AI Ads, Dancing Robots and more!यह सच है. प्रौद्योगिकी हमारा इंतजार नहीं करती. जब पूछा गया कि फेसबुक टीम कैसे काम करती है, तो युवा मार्क जुकरबर्ग ने कहा, “तेजी से आगे बढ़ें और चीजों को तोड़ दें।” बहुत समय पहले जैसा लगता है, है ना? खैर, क्योंकि तकनीक की प्रकृति ही तेजी से आगे बढ़ना और चीजों को तोड़ना है। इसलिए हमें हर हफ्ते मिलना होगा। तो, इस सप्ताह तकनीकी जगत में वास्तव में क्या हुआ? अपनी सीट बेल्ट बांधें और इसे तुरंत पढ़ें। आएँ शुरू करें।

ग्रोक अब छवियां बना सकता है!

जैसे ही खबर आई, अनफ़िल्टर्ड, उच्च-गुणवत्ता वाली छवि निर्माण, अधिक मज़ेदार मोड और बेहतरीन कोडिंग कौशल वाले मिनी मॉडल, ग्रोक के पास अब यह सब है। ग्रोक 2 (बीटा) एक अचानक आगे की छलांग है जो प्रतिस्पर्धियों को उनके पैसे के लिए प्रतिस्पर्धा देता है। पिछले सप्ताह, एक्स के सभी प्रीमियम उपयोगकर्ताओं ने अचानक चित्र बनाने की क्षमता प्राप्त कर ली। यह इतना तेज़ था कि मुझे यह जांचना पड़ा कि यह ग्रोक पर है या कुछ और। उनके अविश्वास के कारण, और बिना किसी धूमधाम के, एक नया अल्ट्रा-फास्ट मॉडल आ गया। ओपन-सोर्स FLUX genAI मॉडल द्वारा संचालित विवादास्पद छवि निर्माण ने ग्रोक 2 के लिए एक सनक पैदा कर दी है। कुछ लोगों ने हास्यास्पद रूप से चरम छवियां बनाई हैं जिन्हें यहां साझा नहीं किया जा सकता है, जिसने “सुरक्षा” टीम को कार्रवाई करने और जिज्ञासु उपयोगकर्ताओं के कुछ प्रतिकूल अनुरोधों को सेंसर करने के लिए प्रेरित किया है। दुनिया भर में होने वाली नवीनतम घटनाओं, नई कोडिंग तकनीकों और जेनएआई को संक्षेप में प्रस्तुत करने की अपनी क्षमता के साथ, ग्रोक 2 बेंचमार्क में खड़ा है और इस समय हमारी दुनिया को समृद्ध करने वाले “मल्टीमॉडल” एलएलएम की सूची में शामिल हो गया है। सबसे अच्छी बात यह है कि यह अभी भी खुला स्रोत है और इसके रिलीज़ होने पर आप पूर्ण संस्करण का उपयोग कर सकेंगे। क्या आप एक्स पर एक प्रीमियम उपयोगकर्ता हैं और ग्रोक का उपयोग कर रहे हैं?

जेमिनी लाइव अब आपका विचार-मंथन भागीदार है।

जेमिनी लाइव Google का स्वामित्व इंटरैक्टिव इंटरफ़ेस है जो अब सभी “जेमिनी एडवांस्ड” उपयोगकर्ताओं के लिए उपलब्ध है। यह उद्योग के अग्रणी OpenAI द्वारा अपने GPT4(omni) मॉडल में समान सुविधाएँ जोड़ने के जवाब में है। Google ने इस सप्ताह नई Pixel 9 श्रृंखला: 9, 9 Pro, 9 Pro XL और 9 Pro फोल्ड के लॉन्च के साथ एक बड़ा बदलाव किया। यह काफी लंबा है, है ना? ठीक है, यदि आपने प्रेजेंटेशन देखने के लिए समय निकाला है, तो आप पहले से ही जानते हैं कि नए हार्डवेयर में निवेश किया गया समय कुल का एक छोटा सा हिस्सा है। हमें वास्तव में नया पिक्सेल अनुभव पसंद है, लेकिन इसमें मौजूद जेमिनी सुविधाएँ सर्वश्रेष्ठ हैं। खासकर पिक्सेल स्टूडियो और जेमिनी लाइव। पिक्सेल स्टूडियो आपको सर्वर की मदद के बिना अपने डिवाइस पर छवियां बनाने की सुविधा देता है, लेकिन जेमिनी लाइव आपको जेमिनी से एक कदम आगे बात करने की सुविधा देता है। नया क्या है? एक एआई से इतनी आज़ादी से बात करने की कल्पना करें जैसे कि आप किसी अन्य इंसान से बात कर रहे हों, बिल्कुल एक नियमित फोन कॉल की तरह। यदि आपके पास कोई नया विचार है और आप उस पर किसी के साथ चर्चा करना चाहते हैं, लेकिन आपके दोस्तों का सोने का समय काफी बीत चुका है, तो अब आप मिथुन राशि वालों के साथ ऐसा कर सकते हैं। क्योंकि मिथुन आपके व्यक्तिगत संदर्भ को याद रखता है और आपको पूरी तरह से नई दिशा में ले जाने के लिए बातचीत के बीच में कूद सकता है। यहां आपको एक अनौपचारिक व्यवहार वाले एक नए आभासी मित्र का वादा किया जाता है जो आपको अजीब महसूस किए बिना आश्चर्यजनक चीजें हासिल करने में मदद करेगा, लेकिन क्या यह लंबे समय में आपका सलाहकार बनने के लिए पर्याप्त होगा? केवल समय बताएगा।


This article is brought to you in partnership with Truetalks Community by Truecaller, a dynamic, interactive network that enhances communication safety and efficiency. https://community.truecaller.com

टाटा कर्वव एडीएएस लेवल 2 डेमो

जबकि टेस्ला ने सटीक दृष्टि के साथ सेल्फ-ड्राइविंग बुद्धिमान कारों की बाधा को तोड़ दिया और Google की वेमो पहली वास्तविक सेल्फ-ड्राइविंग टैक्सी सेवा बन गई, क्रूज़ नियंत्रण और “सहायक ड्राइविंग” लंबे समय से कारों की विशेषताएं रही हैं। किसी तरह हमने इसे भारतीय ब्रांडों में नहीं देखा है, लेकिन मैं वादा करता हूं कि यह बदल जाएगा और एक दिन यह इतना अच्छा होगा कि काफी बुद्धिमान हो जाएगा। भारत के सबसे बड़े ब्रांड समूहों में से एक, टाटा ने अपनी “क्यूब” कारों में “एडीएएस लेवल 2” को रोल आउट करना शुरू कर दिया है। सेडान, इस नई हैचबैक की तरह, इस सुविधा से सुसज्जित हैं जिसका उद्देश्य बुद्धिमत्ता से अधिक सुरक्षा है। यह गति बनाए रख सकता है, वाहनों के बीच दूरी बनाए रख सकता है, इसमें स्वायत्त आपातकालीन ब्रेकिंग है, लेन में रहता है और लेन बदल सकता है। यह ब्लाइंड स्पॉट डिटेक्शन को भी सपोर्ट करता है, जिसमें आपको 3डी थर्ड-पर्सन परिप्रेक्ष्य से पार्क करने में मदद करने के लिए 360-डिग्री दृश्य प्रदान करने के लिए पूरे वाहन बॉडी में सेंसर लगे होते हैं। ऐसा प्रतीत होता है कि रडार, लिडार और अल्ट्रासोनिक के क्षेत्रों में हुड के नीचे बहुत सारे सेंसर हैं। बहुत कुछ स्पष्ट नहीं है, लेकिन फीचर का एक लाइव डेमो ट्विटर पर प्रसारित होना शुरू हो गया है और हालांकि यह काफी विवादास्पद रहा है, लेकिन यह भारत में वास्तविक सड़कों पर प्रौद्योगिकी की एक झलक पाने का एक अच्छा मौका है। टाटा के तकनीकी विकास के बारे में आप क्या सोचते हैं? क्या यह काफी उन्नत है?

हैलाइड – प्रक्रिया शून्य

ऐसे युग में जहां सभी प्रकार के विपणन उद्देश्यों के लिए एआई का अनुसरण करना एक सनक बन गया है, स्वाभाविक रूप से एक प्रति-आंदोलन यह घोषित करते हुए उभरा है कि इसमें एआई क्षमताएं नहीं हैं। सूची में एक नया नाम हैलाइड है, जो iPhone पर आश्चर्यजनक रूप से लोकप्रिय कैमरा ऐप है। यह उन कलाकारों, फ़ोटोग्राफ़रों और वीडियोग्राफरों के बीच बहुत लोकप्रिय है, जिन्हें डिफ़ॉल्ट iPhone सौंदर्य पसंद नहीं है। जो लोग सोचते हैं कि iPhone कैमरा ऐप बहुत “बुनियादी” है, उनके लिए हैलाइड पेशेवर उपकरणों की एक पूरी दुनिया खोलता है जो आपको वही कैप्चर करने में मदद करता है जो आप चाहते हैं, ठीक उसी तरह जैसे आप चाहते हैं। नया “प्रक्रिया शून्य” एक कदम आगे बढ़ता है। हैलाइड ने इस मोड को पेशेवर फोटोग्राफरों के लिए एक विकल्प के रूप में पेश करते हुए दावा किया है, “शून्य एआई। शून्य कम्प्यूटेशनल फोटोग्राफी।” ट्वीट के अनुसार, यह iPhone के इमेज प्रोसेसिंग एल्गोरिदम को पूरी तरह से बायपास करता है और “कच्चे सेंसर डेटा” से तस्वीरें “विकसित” करता है। इसका मतलब है कि आपके पास अपने हार्डवेयर और डेटा तक पूरी पहुंच है, जिसे विशेषज्ञ पसंद करते हैं। बेशक, ऐप्पल आपको 48 से 12 तक गए बिना कच्चे मेगापिक्सेल तक पूर्ण पहुंच की अनुमति नहीं देगा, लेकिन आपको उस बिंदु से पहुंच प्राप्त होगी। आप इन शॉट्स की गुणवत्ता को “फिल्म की तरह” तरीके से फ्रेम कर सकते हैं, जो फिल्म प्रेमियों के लिए अच्छी खबर लगती है। हैलाइड – प्रोसेस ज़ीरो को 2.15 अपडेट के साथ पहले ही जारी किया जा चुका है और iPhone उपयोगकर्ता अब सेंसर का पूरा लाभ उठा सकते हैं और इसे अपनी पसंद के अनुसार संपादित कर सकते हैं।

आर्क ऑफलाइन एआई के साथ एक सर्वाइवल डिवाइस है।

एक बहुत ही दिलचस्प अवधारणा का पहला प्रोटोटाइप इस सप्ताह “अस्तित्व के प्रति उत्साही” के बीच बड़ी प्रत्याशा के साथ सामने आया। हां, तुमने उसे ठीक पढ़ा। हालाँकि यह डिवाइस एक बेहद छोटी जगह पर है, लेकिन यह पूरी तरह से परिभाषित करता है कि एआई डिवाइस क्या हो सकता है। सबसे पहले, यह “चरम स्थितियों में अस्तित्व का साथी” है। चरम स्थितियों का मतलब है कि इंटरनेट अनुपलब्ध है और बिजली दुर्लभ है, अनिवार्य रूप से एक सर्वनाशकारी परिदृश्य जहां गैजेट्स को पूरी तरह से ऑफ़लाइन काम करना पड़ता है। कॉम्पैक्ट टच स्क्रीन की विशेषता वाले इस छोटे गैजेट में वस्तुतः कोई नेटवर्क कनेक्टिविटी नहीं है। यह बेहद मजबूत और मजबूत भी है, जो शीर्ष स्तर के कवच जैसी सामग्रियों और एक विशाल बैटरी द्वारा संरक्षित है, जिससे यह साबुन की एक विशाल पट्टी जैसा दिखता है। या, कुछ लोगों को यह पुराने पोर्टेबल एफएम रेडियो जैसा लग सकता है। लेकिन सबसे अच्छी बात यह है कि यह बुद्धिमान है। हां, विकिपीडिया के सभी ज्ञान और बहुत विशिष्ट अस्तित्व-केंद्रित डेटा से भरा हुआ एक पूरी तरह ऑफ़लाइन एआई है जो सभी प्रकार के “अस्तित्व प्रश्नों” का उत्तर दे सकता है। हमारे पास सड़क-स्तरीय विवरण के साथ दुनिया के पूर्णतः ऑफ़लाइन मानचित्र भी हैं। यह खुद को सौर ऊर्जा से रिचार्ज कर सकता है और यह वास्तव में लंबे समय तक चलता है ताकि आपकी बिजली कभी खत्म न हो। पागलपन लगता है, है ना? खैर, बहुत से लोग नहीं सोचते कि यह वास्तविक हो सकता है, लेकिन बिल्कुल वैसा ही हुआ, और पहले प्रोटोटाइप ने हम सहित कई लोगों को आश्चर्यचकित कर दिया। हम अभी भी नहीं जानते कि यह किसके साथ काम करता है या किस प्रकार के हार्डवेयर इसे अंदर से शक्ति प्रदान करते हैं, लेकिन कुल मिलाकर यह एआई का उन तरीकों से उपयोग करने के लिए एक महान अवधारणा की तरह दिखता है जिनकी हम आमतौर पर कल्पना नहीं करते हैं।

मैकडॉनल्ड्स ने एआई महिला की विशेषता वाला फ्रेंच फ्राइज़ विज्ञापन जारी किया

मैकडॉनल्ड्स जापान अपने स्टोर उत्पादों के लिए शानदार विज्ञापन वीडियो बनाकर एआई कलाकारों को गले लगाने वाला पहला पॉप संस्कृति प्रमुख बन गया है। कलाकार “काकुड्रॉप” ट्विटर सर्किल में “मिडजॉर्नी” और “लुमालैब्स ड्रीम मशीन” जैसे जेनएआई टूल का उपयोग करके अद्भुत छवियां बनाने के लिए जाने जाते हैं। उदाहरण के लिए, उन्होंने टोक्यो में एक व्यस्त सड़क के बीच में सेल्फी लेती एक जापानी लड़की का बहुत यथार्थवादी वीडियो बनाया। स्वाभाविक रूप से, हर कोई जानना चाहता था कि उसने यह कैसे किया, लेकिन वह जापान में इतना प्रसिद्ध हो गया कि उसे अपने काम का प्रदर्शन करने के लिए राष्ट्रीय कला संग्रहालय में आमंत्रित किया गया। चीजें तब और बढ़ गईं जब मैकडॉनल्ड्स ने एक संपूर्ण विज्ञापन बनाने का प्रस्ताव रखा जिसमें एक खूबसूरत जापानी महिला को उनके विश्व प्रसिद्ध फ्रेंच फ्राइज़ खाते हुए दिखाया गया। जिंगल के साथ मिलकर इस एआई विज्ञापन को अकेले ट्विटर पर पहले ही 12.7 मिलियन बार देखा जा चुका है। कल्पना कीजिए कि पूरी तरह से आभासी चरित्र के साथ इसका क्या प्रभाव पड़ेगा। इस अद्भुत विज्ञापन को बनाने के लिए बस एक कलाकार और इंटरनेट कनेक्शन वाला एक कंप्यूटर की आवश्यकता थी। स्पष्ट रूप से, सामग्री निर्माण में एक नया युग आ गया है, GenAI अविश्वसनीय रूप से उच्च-गुणवत्ता वाली छवियां प्रस्तुत करने का वादा करता है जो विज्ञापन से आपकी अपेक्षा से अधिक वास्तविक या बेहतर दिखती हैं।

ड्रीम मशीन 1.5 टेक्स्ट-टू-वीडियो कार्यक्षमता जोड़ता है।

ठीक है, यदि आपने उपरोक्त विज्ञापन देखा है, तो आप जानते हैं कि GenAI वीडियो का यह सारा पागलपन “LumaLabs” जैसे समाधानों के कारण संभव है, जिसने हाल ही में अपने नवीनतम मॉडल, “DreamMachine 1.5” का अनावरण किया है। जो बात ड्रीममशीन को अन्य वीडियो-आधारित GenAI समाधानों से अलग करती है, वह यह है कि यह “इमेज-टू-एनीमेशन” मॉडल के बजाय एक पूर्ण वीडियो मॉडल है। यदि आप इस क्षेत्र से परिचित नहीं हैं, तो इसे समझना मुश्किल हो सकता है, इसलिए मैं इसे सरल शब्दों में समझाता हूं: प्रारंभ में, “जेनएआई वीडियो” ऐप एक छवि के साथ शुरू हुआ और “छवि के शीर्ष पर” एनिमेशन बनाया। प्रत्येक फ़्रेम को पिछली छवि के आधार पर बनाना पड़ा, जिससे बहुत सारी असंगतताएँ उत्पन्न हुईं। इससे विवरणों में एकरूपता बनाए रखना लगभग असंभव हो गया। यही कारण है कि कुछ वीडियो मॉडल “टेक्स्ट टू वीडियो” हो गए हैं, जिसका अर्थ फिर से एक छवि से शुरू करना और फिर संपादकों और वीएफएक्स कलाकारों द्वारा उपयोग की जाने वाली विज़ुअल ट्रिक्स का उपयोग करके छवि के कुछ हिस्सों को “एनिमेट करना” है। इस बीच, LumaLabs ने पूरी तरह से अलग रास्ता अपनाया, पूरी तरह से वीडियो-केंद्रित डेटा का उपयोग करके छवियां लीं और वीडियो विकसित किए। उदाहरण के लिए, प्रत्येक फ़्रेम को एनिमेट और सिलाई करने के बजाय “फ़्रेम के समूह” बनाकर किसी छवि में गति जोड़ें। यह कलाकारों को सहज गति का लाभ उठाने और लंबे वीडियो बनाने के लिए अपना काम जारी रखने के लिए “कीफ़्रेम” जोड़ने की अनुमति देता है। ये प्रमुख अंतर लूमा लैब्स के “ड्रीममशीन” को अब तक के सर्वश्रेष्ठ वीडियो एआई मॉडल में से एक बनाते हैं, और इसके नवीनतम अपडेट 1.5 में यह “टेक्स्ट टू वीडियो” को सक्षम करता है, जिसका अर्थ है कि आप जेनएआई शब्दों में कुछ भी टाइप कर सकते हैं और एक वीडियो प्राप्त कर सकते हैं द अपर हैण्ड। बेशक, पहली बार के विपरीत, यह अभी तक जनता के लिए उपलब्ध नहीं है, लेकिन आप प्रतीक्षा सूची में शामिल हो सकते हैं और जब यह उपलब्ध हो जाए तो इसे आज़मा सकते हैं। इस बीच, एआई उत्साही अभी भी ओपनएआई के पूरी तरह से वीडियो-केंद्रित मॉडल “सोरा” का इंतजार कर रहे हैं, जो खुद गेम-चेंजर होने का वादा करता है।

यूनिट्री जी1 ने बड़े पैमाने पर उत्पादन में प्रवेश किया है।

यहां सबसे अजीब रोबोट वीडियो हैं जो आप इस सप्ताह देखेंगे। यह एक ह्यूमनॉइड रोबोट है जिसे “यूनिट्री G1” कहा जाता है। वे नाचते हैं, कूदते हैं, छलांग लगाते हैं, घूमते हैं और हर तरह का जिमनास्टिक करते हैं जो आपने पहले कभी नहीं देखा होगा। हाँ। सीढ़ियाँ आसानी से चढ़ें, बाधाओं को पार करें और एक सामान्य व्यक्ति की तरह घूमें। इस वीडियो के अंत में कुख्यात डेमो भी है जहां एक व्यक्ति इसे फाड़ने की कोशिश करता है। एक बॉस की तरह संतुलित रहें. चीन स्थित कंपनी “यूनिट्री” का यह पागल वीडियो दिखाता है कि रोबोटिक्स उद्योग “सुदृढीकरण सीखने” या दूसरे शब्दों में, एआई की मदद से कितना आगे बढ़ रहा है। G1 मानव जैसी क्षमताओं वाला एक द्विपाद ह्यूमनॉइड रोबोट है, जो कारखानों में हमारी मदद करने और खतरनाक स्थितियों का प्रबंधन करने के लिए बनाया गया है, जहां मानव इतने मूल्यवान हैं कि उन्हें भेजा नहीं जा सकता। हम सभी इस परिदृश्य को जानते हैं और हमने विभिन्न विज्ञान कथा फिल्मों में देखा है जहां रोबोट अपनी क्षमताओं और बुद्धिमत्ता से मानव दुनिया को बढ़ाते हैं। बेशक, ऐसी चिंताएं हो सकती हैं कि ह्यूमनॉइड्स और उनके तंत्रिका तंत्र हमारी दुनिया के बारे में बहुत अधिक जानकारी प्राप्त कर रहे हैं और “एक-दूसरे से बात करना” शुरू कर रहे हैं, लेकिन क्या हम प्रौद्योगिकी को भविष्य में आगे बढ़ने से रोकने की स्थिति में हैं? और, क्या हम इस स्थिति में हैं कि किसी महान शक्ति को अपनी तकनीक का प्रदर्शन करने से मना कर सकें? यह वास्तव में मामला नहीं है, लेकिन तकनीक का हमेशा एक उद्देश्य होता है, और बेहद चुस्त और लचीली यूनिट्री जी1 का वास्तविक दुनिया में बहुत अच्छा उपयोग होता है, खासकर जब बुजुर्गों और खतरनाक कारखानों और उद्योगों में श्रमिकों की मदद करने की बात आती है।

इस सप्ताह के “टेक्नोलॉजी की दुनिया” के लिए बस इतना ही। यह वास्तव में एक आकर्षक दुनिया है जहां विज्ञान कथा इतनी तेजी से वास्तविकता बन रही है जैसा हमने पहले कभी नहीं देखा था। आनंद लें, ध्यान रखें और अगली बार फिर मिलेंगे।


Leave a Comment