Ses Tabanlı UPI Ödeme İstemleri: Gelişmiş Yapay Zeka Modelleri için Çeşitliliği Yakalama
Shaip'in hızlı kayıt oluşturma ve çeşitli ses kayıtları konusundaki uzmanlığından yararlanarak, ses tabanlı UPI ödeme sistemlerini yüksek kaliteli, kültürel açıdan çeşitli verilerle destekliyoruz.
Projeye Genel Bakış
Shaip, çeşitli UPI ödeme istemleri oluşturarak ve kaydederek ses tabanlı bir ödeme uygulaması geliştirmek için önde gelen bir fintech şirketiyle ortaklık kurdu. Proje, para gönderme, para talep etme, bakiye sorgulama ve fatura ödemeleri gibi 2,500 ödemeyle ilgili amaç için 87,000 benzersiz istem ve 13 çeşitlendirilmiş istemin oluşturulmasını içeriyordu. Bu istemler, çeşitli bölgelerden, geçmişlerden ve yaş gruplarından 200 konuşmacı tarafından 45 saatten fazla kaydedildi ve geniş bir dilsel ve çevresel çeşitlilik sağlandı.
Projenin amacı, gerçek dünya koşullarında UPI ödemeleriyle ilgili sesli komutları tanıyabilen ve yanıtlayabilen bir yapay zeka modeli için yüksek kaliteli eğitim verileri geliştirmekti.
Anahtar İstatistikler
UPI ödeme istemlerinin sesli saatleri kaydedildi
200
Farklı geçmişlere sahip konuşmacılar (yaş, eğitim, bölge)
45
87,000'den fazla çeşitlendirilmiş istemle kapsanan niyetler
13
Diller: İngilizce, farklı ana dil geçmişlerine sahip konuşmacılarla (Kumaoni, Bengalce, Malayalam, Gujarati, Hintçe, Marathi vb.)
Proje kapsamı
Hızlı Yaratılış
Kapsam, ses tabanlı bir UPI ödeme sistemi için benzersiz istemler oluşturmayı içeriyordu. İstemler, yapı, kelime bilgisi ve adlandırılmış varlıklar açısından çeşitlilik sağlayarak birden fazla amacı kapsayacak şekilde tasarlandı. Bazı önemli yönler şunları içeriyordu:
13 Temel Niyet şunlardır:
- Para göndermek: 65,653 benzersiz ve çeşitli istemler
- Bakiye Sorgulama: 3,052 istem
- Para İste: 26,972 istem
- İşlem Geçmişi, Kontör Yükleme, Fatura Ödeme vb.
Ses Kaydı
Gerçekliği ve gerçek dünya uygulanabilirliğini sağlamak için, farklı dil geçmişlerine sahip 45 konuşmacı tarafından istemler kaydedildi. Farklı ana diller, bölgesel lehçeler ve ortamlar (iç ve dış mekan) aracılığıyla yakalanan çeşitlilik, eğitim verilerinin geliştirilmesine yardımcı oldu.
- Dil Çeşitliliği: Kullanıcılar İngilizce'yi akıcı bir şekilde konuşabiliyor ancak Kumaoni, Gujarati, Hintçe, Bangla, Marathi ve Malayalam gibi çeşitli ana dilleri de konuşabiliyor.
- Yaş, Cinsiyet ve Eğitim Durumu: Veriler geniş bir demografik yelpazeyi kapsıyordu.
- Kentsel ve Kırsal Konuşmacılar: Gerçek dünyadaki kullanımını yansıtmak için hem kentsel hem de kırsal kesimdeki konuşmacılar dahil edildi.
- Kayıt Ortamı: Ses kayıtları hem iç hem de dış mekanlarda yapıldı ve çeşitli arka plan gürültüleri de eklendi.
Meydan Okumalar
Dilsel ve Bölgesel Çeşitlilik
İstemlerin farklı bölgesel lehçeleri ve konuşmacı özelliklerini yansıtmasını sağlamak dikkatli bir planlama ve uygulama gerektiriyordu.
Doğal Ses Değişimleri
Gerçek dünyadaki uygulamalar için arka plan gürültülerinin ve çevre koşullarının (iç mekan ve dış mekan) ele alınması kritik önem taşıyordu.
Çeşitli Konuşmacı Profilleri
Farklı yaş gruplarından, eğitim geçmişlerinden ve kırsal/kentsel bölgelerden konuşmacıların dahil edilmesi, otantik verilerin toplanmasında karmaşıklıklara yol açtı.
Çözüm
Shaip, hem metin oluşturma hem de kayıt aşamalarında gelişmiş NLP tekniklerini ve dikkatli planlamayı uygulayarak projenin zorluklarını ele alan bir çözüm sundu. Çözümün temel unsurları şunlardı:
Hızlı Yaratılış
- 2,500 Her biri yapı ve kelime dağarcığı bakımından çeşitlendirilmiş, benzersiz istemler oluşturuldu.
- 13 temel ödeme isteklerinden işlem geçmişi ve fatura ödemeleri gibi daha karmaşık sorgulamalara kadar uzanan amaçlar ele alındı.
Ses Kaydı
- En fazla 200 saat içerisinde size döneceğiz. ses kayıtlarının bir kısmı 45 kullanıcılarının, yerel diller, ortamlar ve konuşmacı demografileri arasında çeşitliliğin sağlanması.
- Doğal ses çeşitliliğini sağlamak için kayıtlarda hem iç hem de dış ortamlar kullanıldı.
- Konuşanlar çeşitli bölgesel lehçeleri temsil ederek dilsel temsilin doğru olmasını sağladılar.
| Niyet | Gönder | Bakiye Sorgulama | Para İste | işlem geçmişi |
|---|---|---|---|---|
| İstemi | Sumatri'ye ev kirası için yirmi bir yüz ödeme yapın | Tasarruf hesabımdaki mevcut bakiyemi öğrenmek istiyorum. | Acil bir durum için Raji, üç yüz on sekiz rupi isteyebilir misiniz? | Bana banka kartı işlem geçmişimi göster. |
| Gujarati | સુમાત્રીને ઘરના ભાડા પેટે એકવીસસો ચૂકવો | Bu, şu anda geçerli olan bir sorundur. işte bu. | શું તમે રાજી પાસેથી ઇમર્જન્સી માટે ત્રણસો અઢા Peki bu ne anlama geliyor? | Bu çok önemli bir şey. |
| Hintçe | Bu çok önemli bir şey. işte bu. | Bu çok önemli bir şey. işte bu | Bu çok önemli bir şey. Peki bu mümkün mü? | Bu çok önemli bir şey. |
| Malayalam | വീട്ടുവാടകയായാ bu çok iyi. | bu çok önemli. Bu çok önemli. | bu çok önemli. ne düşünüyorsunuz? | Bu çok önemli bir şey. |
| telugu | ఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒక్క వంద చెల్ల ించండి | నేను నా సేవింగ్స్ అకౌంట్ లో నా ప్రస్తుత బ్యాల bu çok önemli. | ఎమర్జెన్సీ కోసం రాజిని మూడు వందల పద్దెనిమిది Ne oldu? | నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రను నాకు చూపి Evet. |
| Bangla (বাংলা) | Bu, çok önemli bir sorundur. bu | Bu çok önemli bir şey. স জানতে চাই। | Bu çok önemli bir şey. Gerçekten ne düşünüyorsunuz? | Bu çok önemli bir şey. |
| Marathi | Bu çok önemli. bu çok iyi. | Bu çok önemli bir şey. bu çok iyi. | आपण राजीकडू0 Ne oldu? | Bu çok önemli. |
Sonuç
Shaip tarafından sağlanan yüksek kaliteli, çeşitli ses verileri, müşterinin çeşitli lehçelerde, ortamlarda ve bağlamlarda komutları tanıyabilen yapay zeka destekli ses tabanlı bir UPI ödeme sistemi geliştirmesine olanak sağladı. Veriler şunları geliştirmeye yardımcı oldu:
- Gerçek zamanlı ses tanıma karmaşık ortamlarda.
- Daha doğru UPI işlemi daha geniş bir kullanıcı yelpazesine hitap edecek şekilde tasarlanmıştır.
- Ölçeklenebilirlik: Proje, diğer Hint dillerine de yayılmak için güçlü bir temel oluşturuyor.
Teslim
- En fazla 200 saat içerisinde size döneceğiz. ses dosyalarının (8 kHz PCM WAV formatı, mono)
- 87,000+ benzersiz amaçlarla açıklanan çeşitli istemler
- Meta veri: Konuşmacı profilleri, ortam ayrıntıları ve transkripsiyon doğruluğu
Shaip'in benzersiz istemler ve gerçek ses kayıtları aracılığıyla Hindistan'ın çeşitliliğini yakalama becerisi, ses tabanlı UPI ödeme sistemimiz için oyunun kurallarını değiştirdi. Ekipleri, istemin oluşturulmasından kayıt kalitesine kadar projenin her yönünün hassasiyetle ele alınmasını sağlayarak daha kapsayıcı, sağlam bir ses tanıma modeli oluşturmamıza yardımcı oldu.