Vaka Çalışması: İfade Koleksiyonu

Gerçek Dünya Çözümü
Küresel konuşmaları destekleyen veriler
Sözcük eğitimine duyulan ihtiyaç, tüm müşterilerin etkileşimde bulunurken veya sesli asistanlarına komut dosyası biçiminde sorular sorarken tam sözcükleri veya tümcecikleri kullanmaması nedeniyle ortaya çıkar. Bu nedenle, belirli ses uygulamalarının spontan konuşma verileri üzerinde eğitilmesi gerekir. Örneğin, “En yakın hastane nerede?” "Yakınımda bir hastane bul" veya "Yakınlarda bir hastane var mı?" tümü aynı arama amacını gösterir ancak farklı şekilde ifade edilir.

Sorun
Müşterilerin Dijital Asistanının dünya çapındaki dillere yönelik konuşma yol haritasını yürütmek için ekibin konuşma tanıma AI modeli için büyük hacimli eğitim verisi alması gerekiyordu. Müşterinin kritik gereksinimleri şunlardı:
- 3 küresel dilde konuşma tanıma hizmetleri için büyük hacimli eğitim verisi (tek konuşmacının 30-13 saniyeden uzun olmayan istemleri) elde edin
- Her dil için tedarikçi, konuşmacıların kaydetmesi için metin istemleri oluşturacaktır (
istemci malzemeleri) ve elde edilen sesi kopyalayın. - İlgili JSON dosyalarıyla birlikte ses verilerini ve kaydedilmiş ifadelerin yazıya dökülmesini sağlayın
tüm kayıtlar için meta verileri içerir. - Yaşa, cinsiyete, eğitime ve lehçeye göre farklı bir konuşmacı karışımı sağlayın
- Spesifikasyonlara göre çeşitli kayıt ortamları karışımı sağlayın.
- Her ses kaydı en az 16 kHz, ancak tercihen 44 kHz olacaktır.
Konuşmalı Yapay Zeka uygulama geliştirmenizi %100 oranında hızlandırın
“Birçok tedarikçiyi değerlendirdikten sonra, müşteri Shaip'i konuşma AI projelerinde uzmanlıkları nedeniyle seçti. Shaip'in proje yürütme yeteneğinden, 13 dilde uzman dilbilimcilerden gerekli ifadeleri sıkı zaman çizelgeleri içinde ve gerekli kalitede kaynaklama, yazıya dökme ve sunma konusundaki uzmanlıklarından etkilendik.”
Çözüm
Konuşmaya dayalı yapay zeka konusundaki derin anlayışımızla, müşterinin yapay zeka destekli Konuşma İşleme çok dilli Ses Paketini eğitmek için uzman dilbilimcilerden ve yorumculardan oluşan bir ekiple verileri toplamasına, yazıya dökmesine ve açıklama eklemesine yardımcı olduk.
Shaip'in çalışma kapsamı, konuşma tanıma için büyük hacimli ses eğitimi verilerinin elde edilmesini, Tier 1 ve Tier 2 dil yol haritamızdaki tüm diller için birden çok dilde ses kayıtlarının deşifre edilmesini ve bunlara karşılık gelen mesajların sunulmasını içeriyordu ancak bunlarla sınırlı değildi. JSON meta verileri içeren dosyalar. Shaip, karmaşık projeler için ML modellerini eğitmek için gereken istenen kalite seviyelerini korurken, ölçekte 3-30 saniyelik ifadeler topladı.
- Toplanan, Yazıya Aktarılan ve Açıklamalı Ses: 22,250 saat
- Desteklenen Diller: 13 (Danimarka, Kore, Suudi Arabistan Arapça, Felemenkçe, Anakara ve Tayvan Çincesi, Kanada Fransızcası, Meksika İspanyolcası, Türkçe, Hintçe, Lehçe, Japonca, Rusça)
- Söz Sayısı: 7M +
- Zaman Çizelgesi: 7-8 ay
16 kHz'de sesli ifadeleri toplarken, farklı kayıt ortamlarında yaşa, cinsiyete, eğitime ve lehçelere göre sağlıklı bir konuşmacı karışımı sağladık.
Sonuç
Uzman dilbilimcilerden alınan yüksek kaliteli ifade ses verileri, müşterinin çok dilli Konuşma Tanıma modelini 13 Küresel Kademe 1 ve 2 dilde doğru bir şekilde eğitmesi için güçlendirdi. Altın standart eğitim veri kümeleriyle müşteri, gelecekteki gerçek dünya sorunlarını çözmek için akıllı ve sağlam dijital yardım sunabilir.
Uzmanlığımız
Önerilen Kaynaklar
Alıcı Rehberi
Alıcı Kılavuzu: Konuşmaya Dayalı Yapay Zeka
Sohbet ettiğiniz sohbet robotu, tonlarca konuşma tanıma veri kümesi kullanılarak eğitilmiş, test edilmiş ve oluşturulmuş gelişmiş bir konuşma tabanlı yapay zeka sisteminde çalışır.
Blog
Konuşma Yapay Zekasının Durumu 2025
Konuşmalı AI 2025 bilgi grafikleri, Konuşmalı AI'nın ne olduğu, evrimi, türleri, Bölgeye göre Konuşmalı AI Pazarı, Kullanım Örnekleri, zorluklar vb. hakkında konuşur.
Blog
Siri ve Alexa Ne Dediğini Nasıl Anlıyor?
Sesli asistanlar, en yakın restoranı veya alışveriş merkezine giden en kısa yolu bulma isteklerinize yanıt veren bu havalı, ağırlıklı olarak kadın sesleri olabilir.
Bir sonraki AI girişiminize nasıl yardımcı olabileceğimizi bize bildirin.