Vaka Çalışması: İfade Koleksiyonu

7 dilde Çok dilli dijital asistanlar oluşturmak için 13 Milyondan fazla İfade teslim edildi

Söz Koleksiyonu

Gerçek Dünya Çözümü

Küresel konuşmaları destekleyen veriler

Sözcük eğitimine duyulan ihtiyaç, tüm müşterilerin etkileşimde bulunurken veya sesli asistanlarına komut dosyası biçiminde sorular sorarken tam sözcükleri veya tümcecikleri kullanmaması nedeniyle ortaya çıkar. Bu nedenle, belirli ses uygulamalarının spontan konuşma verileri üzerinde eğitilmesi gerekir. Örneğin, “En yakın hastane nerede?” "Yakınımda bir hastane bul" veya "Yakınlarda bir hastane var mı?" tümü aynı arama amacını gösterir ancak farklı şekilde ifade edilir.

Söz Koleksiyonu1

Sorun

Müşterilerin Dijital Asistanının dünya çapındaki dillere yönelik konuşma yol haritasını yürütmek için ekibin konuşma tanıma AI modeli için büyük hacimli eğitim verisi alması gerekiyordu. Müşterinin kritik gereksinimleri şunlardı:

  • 3 küresel dilde konuşma tanıma hizmetleri için büyük hacimli eğitim verisi (tek konuşmacının 30-13 saniyeden uzun olmayan istemleri) elde edin
  • Her dil için tedarikçi, konuşmacıların kaydetmesi için metin istemleri oluşturacaktır (
    istemci malzemeleri) ve elde edilen sesi kopyalayın.
  • İlgili JSON dosyalarıyla birlikte ses verilerini ve kaydedilmiş ifadelerin yazıya dökülmesini sağlayın
    tüm kayıtlar için meta verileri içerir.
  • Yaşa, cinsiyete, eğitime ve lehçeye göre farklı bir konuşmacı karışımı sağlayın
  • Spesifikasyonlara göre çeşitli kayıt ortamları karışımı sağlayın.
  • Her ses kaydı en az 16 kHz, ancak tercihen 44 kHz olacaktır.

Konuşma AI'nızı hızlandırın
%100 uygulama geliştirme

"Birçok satıcıyı değerlendirdikten sonra müşteri, konuşma tabanlı yapay zeka projelerindeki uzmanlıkları nedeniyle Shaip'i seçti. Shaip'in proje yürütme yetkinliğinden, 13 dilde uzman dilbilimcilerden gerekli ifadeleri sıkı zaman çizelgeleri içinde ve gerekli kalitede kaynaklama, yazıya dökme ve sunma konusundaki uzmanlıklarından etkilendik”

Çözüm

Konuşmaya dayalı yapay zeka konusundaki derin anlayışımızla, müşterinin yapay zeka destekli Konuşma İşleme çok dilli Ses Paketini eğitmek için uzman dilbilimcilerden ve yorumculardan oluşan bir ekiple verileri toplamasına, yazıya dökmesine ve açıklama eklemesine yardımcı olduk.

Shaip'in çalışma kapsamı, konuşma tanıma için büyük hacimli ses eğitimi verilerinin elde edilmesini, Tier 1 ve Tier 2 dil yol haritamızdaki tüm diller için birden çok dilde ses kayıtlarının deşifre edilmesini ve bunlara karşılık gelen mesajların sunulmasını içeriyordu ancak bunlarla sınırlı değildi. JSON meta verileri içeren dosyalar. Shaip, karmaşık projeler için ML modellerini eğitmek için gereken istenen kalite seviyelerini korurken, ölçekte 3-30 saniyelik ifadeler topladı.

  • Toplanan, Yazıya Aktarılan ve Açıklamalı Ses: 22,250 saat
  • Desteklenen Diller: 13 (Danimarka, Kore, Suudi Arabistan Arapça, Felemenkçe, Anakara ve Tayvan Çincesi, Kanada Fransızcası, Meksika İspanyolcası, Türkçe, Hintçe, Lehçe, Japonca, Rusça)
  • Söz Sayısı: 7M +
  • Zaman Çizelgesi: 7-8 ay

16 kHz'de sesli ifadeleri toplarken, farklı kayıt ortamlarında yaşa, cinsiyete, eğitime ve lehçelere göre sağlıklı bir konuşmacı karışımı sağladık.

Sonuç

Uzman dilbilimcilerden alınan yüksek kaliteli ses verileri, müşteriyi doğru şekilde eğitmek için güçlendirdi
13 Global Tier 1 ve 2 dilde çok dilli Konuşma Tanıma modeli. Müşteri, altın standart eğitim veri kümeleriyle, gelecekteki gerçek dünya sorunlarını çözmek için akıllı ve sağlam dijital yardım sunabilir.

Uzmanlığımız

0 +
Toplanan Konuşma Saatleri
0
Ses Verisi Toplayıcıları Ekibi
0 %
PII Uyumlu
0 +
Harika numara
> 0
Veri Kabulü ve Doğruluğu
0 +
Fortune 500 Müşterileri

Bir sonraki AI girişiminize nasıl yardımcı olabileceğimizi bize bildirin.