Vaka Çalışması: İfade Koleksiyonu
7 dilde Çok dilli dijital asistanlar oluşturmak için 13 Milyondan fazla İfade teslim edildi
Gerçek Dünya Çözümü
Küresel konuşmaları destekleyen veriler
Sözcük eğitimine duyulan ihtiyaç, tüm müşterilerin etkileşimde bulunurken veya sesli asistanlarına komut dosyası biçiminde sorular sorarken tam sözcükleri veya tümcecikleri kullanmaması nedeniyle ortaya çıkar. Bu nedenle, belirli ses uygulamalarının spontan konuşma verileri üzerinde eğitilmesi gerekir. Örneğin, “En yakın hastane nerede?” "Yakınımda bir hastane bul" veya "Yakınlarda bir hastane var mı?" tümü aynı arama amacını gösterir ancak farklı şekilde ifade edilir.
Sorun
Müşterilerin Dijital Asistanının dünya çapındaki dillere yönelik konuşma yol haritasını yürütmek için ekibin konuşma tanıma AI modeli için büyük hacimli eğitim verisi alması gerekiyordu. Müşterinin kritik gereksinimleri şunlardı:
- 3 küresel dilde konuşma tanıma hizmetleri için büyük hacimli eğitim verisi (tek konuşmacının 30-13 saniyeden uzun olmayan istemleri) elde edin
- Her dil için tedarikçi, konuşmacıların kaydetmesi için metin istemleri oluşturacaktır (
istemci malzemeleri) ve elde edilen sesi kopyalayın. - İlgili JSON dosyalarıyla birlikte ses verilerini ve kaydedilmiş ifadelerin yazıya dökülmesini sağlayın
tüm kayıtlar için meta verileri içerir. - Yaşa, cinsiyete, eğitime ve lehçeye göre farklı bir konuşmacı karışımı sağlayın
- Spesifikasyonlara göre çeşitli kayıt ortamları karışımı sağlayın.
- Her ses kaydı en az 16 kHz, ancak tercihen 44 kHz olacaktır.
"Birçok satıcıyı değerlendirdikten sonra müşteri, konuşma tabanlı yapay zeka projelerindeki uzmanlıkları nedeniyle Shaip'i seçti. Shaip'in proje yürütme yetkinliğinden, 13 dilde uzman dilbilimcilerden gerekli ifadeleri sıkı zaman çizelgeleri içinde ve gerekli kalitede kaynaklama, yazıya dökme ve sunma konusundaki uzmanlıklarından etkilendik”
Çözüm
Konuşmaya dayalı yapay zeka konusundaki derin anlayışımızla, müşterinin yapay zeka destekli Konuşma İşleme çok dilli Ses Paketini eğitmek için uzman dilbilimcilerden ve yorumculardan oluşan bir ekiple verileri toplamasına, yazıya dökmesine ve açıklama eklemesine yardımcı olduk.
Shaip'in çalışma kapsamı, konuşma tanıma için büyük hacimli ses eğitimi verilerinin elde edilmesini, Tier 1 ve Tier 2 dil yol haritamızdaki tüm diller için birden çok dilde ses kayıtlarının deşifre edilmesini ve bunlara karşılık gelen mesajların sunulmasını içeriyordu ancak bunlarla sınırlı değildi. JSON meta verileri içeren dosyalar. Shaip, karmaşık projeler için ML modellerini eğitmek için gereken istenen kalite seviyelerini korurken, ölçekte 3-30 saniyelik ifadeler topladı.
- Toplanan, Yazıya Aktarılan ve Açıklamalı Ses: 22,250 saat
- Desteklenen Diller: 13 (Danimarka, Kore, Suudi Arabistan Arapça, Felemenkçe, Anakara ve Tayvan Çincesi, Kanada Fransızcası, Meksika İspanyolcası, Türkçe, Hintçe, Lehçe, Japonca, Rusça)
- Söz Sayısı: 7M +
- Zaman Çizelgesi: 7-8 ay
16 kHz'de sesli ifadeleri toplarken, farklı kayıt ortamlarında yaşa, cinsiyete, eğitime ve lehçelere göre sağlıklı bir konuşmacı karışımı sağladık.
Sonuç
Uzman dilbilimcilerden alınan yüksek kaliteli ifade ses verileri, müşterinin çok dilli Konuşma Tanıma modelini 13 Küresel Kademe 1 ve 2 dilde doğru bir şekilde eğitmesi için güçlendirdi. Altın standart eğitim veri kümeleriyle müşteri, gelecekteki gerçek dünya sorunlarını çözmek için akıllı ve sağlam dijital yardım sunabilir.
Uzmanlığımız
Önerilen Kaynaklar
Alıcı Rehberi
Alıcı Kılavuzu: Konuşmaya Dayalı Yapay Zeka
Sohbet ettiğiniz sohbet robotu, tonlarca konuşma tanıma veri kümesi kullanılarak eğitilmiş, test edilmiş ve oluşturulmuş gelişmiş bir konuşma tabanlı yapay zeka sisteminde çalışır.
Blog
Konuşma Yapay Zekasının Durumu 2021
Konuşmalı AI 2021 bilgi grafikleri, Konuşmalı AI'nın ne olduğu, evrimi, türleri, Bölgeye göre Konuşmalı AI Pazarı, Kullanım Örnekleri, zorluklar vb. hakkında konuşur.
Blog
3 Konuşma Yapay Zekasının Evriminin Önündeki Engeller
Shaip, 50'den fazla dilde gerekli açıklamalı ses verilerini sunarak, bir müşteri etkileşim aracı olarak konuşma yapay zekasının evrimini hızlandırıyor.
Bir sonraki AI girişiminize nasıl yardımcı olabileceğimizi bize bildirin.