Wednesday, May 15, 2024
HomeDESHPATRAआर्टिफिशियल इंटेलिजेंस (AI) का मातृभाषा के जरिए आर्थिक सम्बल

आर्टिफिशियल इंटेलिजेंस (AI) का मातृभाषा के जरिए आर्थिक सम्बल

यह स्टार्टअप उन लाखों लोगों की मदद के लिए आगे आया है जिनकी मातृभाषाएं हाशिए पर हैं। एआई से उन्हें आर्थिक लाभ हो सकेगा

नारियल पेड़ की छाया में, चंद्रिका सूरज की रोशनी से बचने के लिए अपने स्मार्टफोन की स्क्रीन थोड़ा तिरछा कर लेती हैं। दक्षिण भारत के एक राज्य कर्नाटक के अलहल्ली गांव में सुबह का वक्त है लेकिन गर्मी और उमस बहुत है। स्क्रॉल करने के साथ ही चंद्रिका एक के बाद एक कई ऑडियो क्लिप पर क्लिक करती हैं। यह उस ऐप की आसानी को प्रदर्शित करता है जिसका उन्होंने हाल ही में उपयोग करना शुरू किया है। हर टैप पर फोन से उन्हें मातृभाषा में अपनी आवाज सुनाई देती है।

चंद्रिका ने इस ऐप का उपयोग करते हुए प्रतिघंटे लगभग 5 डॉलर का वेतन अर्जित किया

इस ऐप का इस्तेमाल शुरू करने से पहले, 30 वर्षीया चंद्रिका (अन्य दक्षिण भारतीयों की तरह, अपने पिता के नाम के पहले अक्षर के. का उपयोग करती हैं, लास्ट नेम के बजाय) के बैंक खाते में पहले केवल 184 रुपए (2.25 डॉलर) थे। अप्रैल के आखिर में उन्होंने कई दिनों तक लगभग छह घंटे काम किया। उन्हें 2,570 रुपए (31.30 डॉलर) की आय हुई। दूर के स्कूल में शिक्षिका के रूप में काम करने के दौरान वह लगभग उतनी ही राशि कमाती थीं, जितनी उन्हें वहां जाने और वापस आने में लगने वाले बस के किराए के बाद बचती थी। आने-जाने में उन्हें तीन बस बदलनी पड़ती थी। अब अपने काम के भुगतान के लिए उन्हें महीने के अंत तक इंतजार नहीं करना पड़ता। कुछ ही घंटों में पैसा उनके बैंक खाते में आ जाता है। केवल अपनी मातृभाषा कन्नड़, जो लगभग 60 मिलियन लोगों द्वारा बोली जाती है, ज्यादातर मध्य और दक्षिणी भारत में, भाषा के पाठ को जोर से पढ़कर, चंद्रिका ने इस ऐप का उपयोग करते हुए प्रतिघंटे लगभग 5 डॉलर का वेतन अर्जित किया है, जो भारतीयों की न्यूनतम आय से लगभग 20 गुना ज्यादा है। और कुछ ही दिनों में 50 फीसद बोनस के रूप में उनके खाते में और पैसा आ जाएगा। एक बार आवाज को सिर्फ वायस क्लिप से मिलाने की जरूरत है।

AI पर टेक्स्ट और ऑडियो डेटा प्रचुर मात्रा में ऑनलाइन उपलब्ध

चंद्रिका की आवाज उन्हें इतनी राशि दिला सकती है? यह सम्भव हुआ है आर्टिफिशियल इंटेलिजेंस (एआई) में आए उछाल की वजह से। फिलहाल, अत्याधुनिक एआई- उदाहरण के लिए चैटजीपीटी अंग्रेजी जैसी भाषाओं में सबसे अच्छा काम कर रहे हैं, जहां टेक्स्ट और ऑडियो डेटा प्रचुर मात्रा में ऑनलाइन उपलब्ध हैं। चैटजीपीटी, कन्नड़ जैसी भाषाओं में बहुत अच्छा नहीं कर पा रहा है क्योंकि यह भाषा लाखों लोगों द्वारा बोले जाने के बावजूद इंटरनेट पर दुर्लभ है। (उदाहरण- विकिपीडिया पर अंग्रेजी में 6 मिलियन लेख हैं, जबकि कन्नड़ में सिर्फ 30,000) तो क्या एआई “कम संसाधन वाली” भाषाओं के लिए पक्षपाती हो सकते हैं? उदाहरण के लिए, एआई का हमेशा यह मानकर चलना कि डॉक्टर पुरुष ही होते हैं और महिलाएं नर्स। इससे भी समस्या गहरा सकती है। अंग्रेजी भाषा बोलने वाले एआई बनाने के लिए, केवल डेटा एकत्र करना ही पर्याप्त है। डेटा तो पहले से ही बड़ी संख्या में जमा है लेकिन कन्नड़ जैसी भाषाओं के लिए आपको बाहर निकल कर बहुत कुछ तलाशना होगा।

AI 1.4 अरब लोगों को उनकी मातृभाषा में डेटा उपलब्ध कराएगा 

एआई ने दुनिया के कुछ सबसे गरीब लोगों द्वारा बोली जाने वाली भाषाओं के डेटासेट- टेक्स्ट या वॉयस डेटा के संग्रह- की भारी मांग उत्पन्न की है। ऐसी मांग उन तकनीकी कंपनियों द्वारा की जाती है जो अपने एआई उपकरण बनाना चाहती हैं। शिक्षा जगत और सरकारों की ओर से भी बड़ी मांग होती है खासकर भारत में, जहां 22 आधिकारिक भाषाओं और कम से कम 780 से अधिक स्वदेशी भाषाओं वाले लगभग 1.4 अरब लोगों के देश में अंग्रेजी और हिन्दी को लंबे समय से प्राथमिकता दी गई है। बढ़ती हुई मांग का मतलब है-करोड़ों भारतीयों का अचानक से एक दुर्लभ और नव-मूल्यवान संपत्ति के मालिक होना। वह मूल्यवान सम्पत्ति है उनकी मातृभाषा।

2030 तक डेटा सेक्टर का वैश्विक मूल्य लगभग 17 बिलियन डॉलर हो जाएगा 

एआई को केन्द्रित करते हुए डेटा उत्पन्न करना या रिफाइन करना, भारत के लिए कोई नया काम भी नहीं है। 20वीं सदी के अंत में जिस अर्थव्यवस्था ने कॉल सेंटरों और कपड़ा कारखानों को उत्पादकता इंजन में बदलने के लिए बहुत कुछ किया, 21वीं सदी में चुपचाप डेटा वर्क के साथ वही किया जा रहा है। इंडस्ट्री में एक बार फिर श्रम मध्यस्थता आधारित कंपनियों, जिसका अर्थ है आउटसोर्सिंग, का प्रभुत्व है। ये कंपनियां न्यूनतम के करीब ही वेतन का भुगतान करती हैं, जबकि भारी शुल्क वसूलने के लिए डेटा विदेशी ग्राहकों को बेचती हैं। वर्ष 2022 में डेटा सेक्टर का वैश्विक मूल्य लगभग 2 बिलियन डॉलर से ज्यादा था जिसके 2030 तक बढ़कर 17 बिलियन डॉलर हो जाने का अनुमान है। इस धन का बहुत कम हिस्सा ही भारत, केन्या और फिलीपींस के डेटा वर्कर्स को मिला है।

AI के माध्यम से पूरा समाज प्रभावित हो रहा है 

ये स्थितियां व्यक्तिगत रूप से काम कर रहे श्रमिकों की जिन्दगी को कहीं अधिक नुकसान पहुंचा सकती हैं। ऑक्सफोर्ड यूनिवर्सिटी के इंटरनेट इंस्टीट्यूट में डिजिटल वर्क प्लेटफॉर्म के विशेषज्ञ जोनास वैलेंटे कहते हैं- ‘हम उस व्यवस्था के बारे में चर्चा कर रहे हैं जो हमारे पूरे समाज को प्रभावित कर रही है और वर्कर्स उन व्यवस्थाओं को विश्वसनीय और कम पक्षपाती बनाते हैं।’ वह आगे कहते हैं- ‘अगर आपके पास मूलभूत अधिकारों की जानकारी रखने वाले कर्मचारी हैं और ज्यादा सशक्त भी, तो मेरा मानना है कि तकनीकि व्यवस्था के जरिए जो परिणाम आएंगे, उनका गुणवत्ता बेहतर होगी।’
अलहल्ली और चिलुकावाड़ी के निकटवर्ती गांवों में, एक भारतीय स्टार्टअप नए मॉडल का परीक्षण कर रहा है। चंद्रिका, ‘कार्या’ के लिए काम करती हैं। ‘कार्या’ एक गैर-लाभकारी संस्था है जिसे 2021 में बेंगलुरु (पूर्व नाम बैंगलोर) में लॉंच किया गया था जो खुद को ‘दुनिया की पहली एथिकल डेटा कंपनी’ के रूप में पेश करती है। अपने अन्य प्रतिद्वंद्वियों की तरह, यह भी बाजार दर पर बड़ी तकनीकि कंपनियों और अन्य ग्राहकों को डेटा बेचती है। अपनी लागत को कवर करती है लेकिन उस रकम का अधिकांश हिस्सा लाभ के रूप में अपने पास रखने के बजाय शेष राशि भारत के ग्रामीण इलाकों के गरीबों को भेज देती है। (कार्या ने स्थानीय गैर सरकारी संगठनों के साथ साझेदारी की है ताकि यह सुनिश्चित किया जा सके कि उसकी नौकरियों तक पहुंच सबसे गरीब लोगों के साथ-साथ हाशिए पर रहने वाले समुदायों की हो।) अपने वर्कर्स को प्रति घंटे न्यूनतम 5 डॉलर देने वाला ‘कार्या’ श्रमिकों को उनके द्वारा बनाए गए डेटा का वास्तविक स्वामित्व भी देता है। जब श्रमिक इसे फिर बेचते हैं तो श्रमिकों को उनके पिछले वेतन के अलावा आय भी हासिल होती है। यह एक ऐसा मॉडल है जो इंडस्ट्री में कहीं अन्य जगह नहीं है।

AI के द्वारा ग्रामीण अपनी भाषा में कंप्यूटर सीख पायेंगे 

‘कार्या’ जो काम कर रही है, उसका मतलब यह भी है कि लाखों लोग जिनकी भाषाएं ऑनलाइन हाशिए पर हैं, एआई सहित प्रौद्योगिकी के लाभों तक बेहतर पहुंच हासिल कर सकती हैं। 23 वर्षीय छात्रा विनुथा, जिसने माता-पिता पर अपनी वित्तीय निर्भरता कम करने के लिए ‘कार्या’ में काम किया है, कहती हैं- ‘गांवों में ज्यादातर लोगों को अंग्रेजी नहीं आती। यदि कम्प्यूटर कन्नड़ समझ सकता तो यह बड़ा फायदेमंद होगा।’ कार्या के 27 वर्षीय सीईओ मनु चोपड़ा कहते हैं-‘अभी जो वेतन दिया जा रहा है, वह बाजार की विफलता है।’ वह आगे कहते हैं-‘हमने कार्या को गैर-लाभकारी संस्था बनाने का फैसला इसलिए किया क्योंकि मौलिक रूप से आप बाजार में बाजार की विफलता का समाधान नहीं कर सकते।’ आप इसे इस तरह भी कह सकते हैं कि काम तो पूरक है।

AI लाखों लोगों को गरीबी से बाहर निकालने का यह सबसे गतिशील और अच्छा तरीका साबित होगा 

कार्या अपने कर्मचारियों से पहली बात जो कहता है, वह यह हैः यह कोई स्थायी नौकरी नहीं है, बल्कि यह जल्दी से आय बढ़ाने का एक तरीका है जो आपको आगे बढ़ने और अन्य काम करने की अनुमति देगा। ऐप के जरिए एक कर्मचारी अधिकतम 1,500 डॉलर की आय अर्जित कर सकता है जो भारत में औसत वार्षिक आय है। उस बिंदु के बाद, वर्कर्स किसी और के लिए रास्ता बनाते हैं। कार्या का कहना है कि उसने देश भर में लगभग 30,000 ग्रामीण भारतीयों को मजदूरी के रूप में 65 मिलियन रुपए (लगभग 8,00,000 डॉलर) का भुगतान किया है। चोपड़ा चाहते हैं कि कार्या की पहुंच 2030 तक 100 मिलियन लोगों तक हो। गरीबी में जन्मे और स्टैनफोर्ड में छात्रवृत्ति हासिल करने वाले चोपड़ा कहते हैं- ‘मुझे वास्तव में लगता है कि अगर सही तरीके से काम किया जाए तो लाखों लोगों को गरीबी से बाहर निकालने का यह सबसे गतिशील और अच्छा तरीका है।’ वह कहते हैं कि निश्चित रूप से यह सामाजिक परियोजना है। वेल्थ इज पावर। हम उन समुदायों को धन का पुनर्वितरण करना चाहते हैं जो पीछे छूट गए हैं।

AI बीमारियों के इलाज में भी सहायक होगा 

ये ग्रामीण जो काम कर रहे हैं, वह नई परियोजना का हिस्सा है जिसे कार्या स्वास्थ्य सेवा क्षेत्र के एनजीओ के साथ कर्नाटक राज्य में शुरू कर रहा है। टीबी को लेकर स्पीच डेटा (आवाज का डेटा संग्रह करने की प्रक्रिया) का संग्रह किया जा रहा है। टीबी इलाज योग्य और रोकथाम योग्य बीमारी है। इस बीमारी से अभी भी हर साल लगभग दो लाख भारतीयों की जान चली जाती है। आवाज की रिकॉर्डिंग कन्नड़ भाषा की दस अलग-अलग बोलियों में की जा रही है जिससे एआई स्पीच मॉडल के लिए प्रशिक्षित किया जाएगा। टीबी के बारे में एआई स्थानीय लोगों के सवालों, उनकी समस्याओं को समझेगा और जवाब भी देगा जिससे बीमारी के फैलने का खतरा कम हो सकेगा। उम्मीद यही है कि यह ऐप जब तैयार हो जाएगा, अशिक्षित लोगों को विश्वसनीय जानकारी देने में सक्षम होगा, जानकारी तक पहुंच को आसान बनाएगा। टीबी के मरीज को भी इस कलंक से निपटने में आसानी मिलेगी। यह रिकॉर्डिंग कन्नड़ डेटासेट के हिस्से के रूप में कार्या के प्लेटफॉर्म पर बिक्री के लिए भी जाएगी। एआई कम्पनियां इससे फायदा उठा सकेंगी। हर बार जब इसे दोबारा बेचा जाएगा तो 100 फीसद राजस्व उन कार्या कार्यकर्ताओं में बांटा जाएगा जिन्होंने डेटासेट में योगदान दिया था। राशि का वितरण इस काम में उनके द्वारा खर्च किए गए घंटों के अनुसार किया जाएगा।

कार्या अमेरिका में एक गैर-लाभकारी संस्था के रूप में पंजीकृत है

चोपड़ा कहते हैं कि वह अपने ऐप को 2030 तक 100 मिलियन भारतीयों तक पहुंचाना चाहते हैं। ऐसे लाखों लोग हैं जो उच्च वेतन के अवसर का लाभ उठाएंगे और कार्या ने उन्हें अपने साथ जोड़ने के लिए 200 से अधिक जमीनी स्तर के गैर सरकारी संगठनों का एक जांचा-परखा नेटवर्क बनाया है। वह कहते हैं कि हमें बड़े पैमाने पर जागरूकता बढ़ाने की जरूरत है। चोपड़ा का मानना है कि ऐप के प्रभाव के लिए, उन्हें अधिक ग्राहकों के भरोसे की जरूरत है। ज्यादा प्रौद्योगिकी कंपनियों, सरकारों और शैक्षणिक संस्थानों को राजी करना होगा कि वे कार्या से अपना एआई प्रशिक्षण डेटा प्राप्त करें।
लेकिन अक्सर होता यह है कि नैतिकता पर गर्व करने वाली कंपनियां नए ग्राहकों की तलाश के लिए समझौता कर सकती हैं। ऐसा न होने देने के लिए कार्या क्या करेगी? अपने जवाब के हिस्से में, चोपड़ा कहते हैं कि इसका जवाब कार्या की कॉर्पोरेट संरचना में निहित है। कार्या अमेरिका में एक गैर-लाभकारी संस्था के रूप में पंजीकृत है जो भारत में दो संस्थाओं को नियंत्रित करती है: एक गैर-लाभकारी और एक लाभ के लिए। लाभ कमाने वाली संस्था कानूनी रूप से अपने किसी भी लाभ को (कर्मचारियों को प्रतिपूर्ति करने के बाद) गैर-लाभकारी संस्था को दान देने के लिए बाध्य है जिससे री-इन्वेस्ट होता है। चोपड़ा कहते हैं, कार्या अनुदान निधि लेता है। यह अपने सभी 24 पूर्णकालिक कर्मचारियों के वेतन को कवर करता है लेकिन आंतरिक रूप से गैर-लाभकारी मॉडल संभव होने के लिए पर्याप्त नहीं है। चोपड़ा का कहना है कि इस व्यवस्था से उन्हें या उनके सह-संस्थापकों को आकर्षक अनुबंधों के बदले में श्रमिकों के वेतन या कल्याण से समझौता करने के लिए किसी भी प्रोत्साहन को हटाने का लाभ मिलेगा।
द/नज इंस्टीट्यूट की मैनेजिंग पार्टनर सुभाश्री दत्ता, जिन्होंने कार्या को 20 हजार डॉलर के अनुदान के साथ अपना सहयोग दिया है, कहती हैं-‘कार्या बहुत युवा संस्था है। उसके पास अपने मूल्यों के प्रति ईमानदार रहने और फिर भी पूंजी को आकर्षित करने की क्षमता है। मुझे नहीं लगता कि कार्या लाभ के लिए अथवा गैर-लाभ के लिए कशमकश की स्थिति में रहेगी।
दक्षिणी कर्नाटक में कार्या कार्यकर्ताओं के साथ दो दिन बिताने के बाद कार्या की मौजूदा व्यवस्था की सीमाएं दिखने लगीं। हर कार्यकर्ता का कहना था कि उन्होंने ऐप पर 1,287 टास्क पूरे कर लिए हैं। मेरे दौरे के समय, टीबी परियोजना पर उपलब्ध कार्यों की संख्या में यह अधिकतम है। श्रमिकों को मिलने वाली राशि एक स्वागत योग्य प्रोत्साहन है, लेकिन लंबे समय तक ऐसा नहीं चलने वाला है। अपनी यात्रा में, मैं ऐसे किसी भी कर्मचारी से नहीं मिला, जिसे रॉयल्टी मिली हो। चोपड़ा ने मुझसे कहा कि कार्या ने खरीदारों के लिए पर्याप्त पुनर्विक्रय योग्य डेटा एकत्र किया है; अब तक लगभग 4,000 श्रमिकों को 1,16,000 डॉलर की रॉयल्टी बांटी गई है।
मैंने चोपड़ा से बातचीत में कहा कि इन ग्रामीणों के जीवन पर सार्थक असर पड़ने में अभी बहुत समय लगेगा? उन्होंने जवाब दिया कि टीबी परियोजना तो अभी इन कामगारों के लिए शुरुआत है। वे जल्द ही ट्रांसक्रिप्सन टास्क पर काम शुरू करने जा रहे हैं। ट्रांसक्रिप्सन टास्क कन्नड़ सहित कई क्षेत्रीय भाषाओं में एआई मॉडल बनाने के लिए भारत सरकार के प्रयासों का हिस्सा है। उनका कहना है कि इससे कार्या को चिलुकावडी में ग्रामीणों को “बहुत ज्यादा” काम देने की अनुमति मिलेगी। फिर भी कामगार 1,500 डॉलर से बहुत दूर हैं जो कार्या के सिस्टम में है। चोपड़ा ने स्वीकार भी किया कि कार्या के 30,000 कर्मचारियों में से एक भी 1,500 डॉलर की सीमा तक नहीं पहुंचा है। फिर भी काम के प्रति उनका लगाव, काम के प्रति उनकी अधिक इच्छा स्पष्ट है। शेषाद्रि, जो अब कार्या के मुख्य प्रौद्योगिकी अधिकारी हैं, ने जब कामगारों से भरे कमरे में जब उनसे पूछा कि क्या वह कन्नड़ वाक्यों में अशुद्धियों को चिह्नित करने वाले नए कार्य में खुद को सक्षम महसूस करेंगे तो वे उत्साहित हो गए. उन्होंने सर्वसम्मति से हां में जवाब दिया।
मैं चिलुकावाडी और अलहल्ली गांव में जिन लोगों से मिला और बात की तो लगा कि उनकी ऑर्टिफिशियल इंटेलीजेंस के बारे में समझ सीमित है। चोपड़ा कहते हैं कि श्रमिकों को यह समझाना चुनौतीपूर्ण हो सकता है कि वे क्या कर रहे हैं। उनका कहना है कि उनकी टीम ने समझाने का जो सबसे सफल तरीका खोजा है, वह है कर्मचारियों को यह बताना कि वे ‘ कंप्यूटर को कन्नड़ बोलना सिखा रहे हैं’। यहां कोई भी चैटजीपीटी के बारे में नहीं जानता, लेकिन गांव वालों को मालुम है कि गूगल असिस्टेंट (जिसे वे ‘ओके गूगल’ कहते हैं) तब बेहतर काम करता है जब आप इससे अपनी मातृभाषा की तुलना में अंग्रेजी में कहते हैं। तीन बच्चों के 35 वर्षीय बेरोजगार पिता सिद्धाराजू एल. का कहना है कि उन्हें नहीं मालुम कि एआई क्या होता है, लेकिन अगर कंप्यूटर उनकी भाषा बोल सके तो उन्हें गर्व महसूस होगा। मेरे मन में अपने माता-पिता के लिए जितना सम्मान है, उतना ही सम्मान अपनी मातृभाषा के लिए भी है। जिस तरह भारत 4जी मामले में बाकी दुनिया से आगे निकलने में सक्षम था, क्योंकि उस पर मौजूदा मोबाइल डेटा इंफ्रास्ट्रक्चर का बोझ नहीं था। उम्मीद है कि उसी तरह कार्या की कोशिशों से भारतीय भाषा की एआई परियोजनाओं को सीखने में मदद मिलेगी। कहीं अधिक विश्वसनीय और निष्पक्ष बिंदु से शुरुआत करें। स्पीच शोधकर्ता बाली अपने उच्चारण को संदर्भित करते हुए कहती हैं, ‘कुछ वक्त पहले तक अंग्रेजी के लिए स्पीच-पहचान इंजन मेरी अंग्रेजी भी नहीं समझता था।’ वह यह भी कहती हैं-‘एआई प्रौद्योगिकियों के होने का क्या मतलब, अगर वे उपयोगकर्ताओं की जरूरत पूरा नहीं कर पाएं?’

RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisment -

Most Popular

Recent Comments