Anahtar Sözcük/İstem Sesi Koleksiyonu

Vaka Çalışması: Araç içi sesle etkinleştirilen sistemler için Anahtar Sözcük Koleksiyonu

Anahtar kelime öbeği koleksiyonu

Otomobil Endüstrisinde araç içi sesle etkinleştirilen sistemlere yönelik artan bir talep var ve bu, mobilite araçlarımızla nasıl ilişki kurduğumuzu yeniden tanımlıyor.

Otomotiv endüstrisi, Ford, Tesla ve BMW gibi büyük oyuncuların araçlarına gelişmiş ses tanımayı entegre etmesiyle sesle etkinleştirilen sistemleri hızla benimsedi. 2022 yılına kadar, yeni arabaların %50'sinden fazlasının ses tanıma özelliklerine sahip olduğu tahmin ediliyor. Bu entegrasyonlar, sürücülerin dikkati dağılmadan navigasyon, eğlence ve iletişim işlevlerini kullanmalarına izin vererek güvenliği artırmayı amaçlıyor.

Otomobillerde ses tanımanın piyasa değerinin 1 yılına kadar 2023 milyar doları aşacağı tahmin ediliyor ve bu da eller serbest, akıllı araç içi etkileşimlere yönelik artan talebi gösteriyor.

Otomotiv

Araştırmalar, 2022 yılına kadar sürücülerin %73'ünün araç içi sesli asistan kullanacağını gösteriyor.

Otomotiv Ses Tanıma Sistemi Pazarı 2.01'de 2021 Milyar ABD Doları değerindeydi ve 3.51'de yaklaşık %2027'lik bir YBBO kaydederek 8.07 Milyar ABD Dolarına ulaşması bekleniyor.

Gerçek Dünya Çözümü

Sesle etkinleştirilen sistemlere güç sağlayan veriler

Arabalardaki sesle etkinleştirilen sistemler, güvenliği ve rahatlığı artırır. Sürücülerin ellerini direksiyondan veya gözlerini yoldan ayırmadan navigasyona erişmesine, arama yapmasına, metin göndermesine ve müziği kontrol etmesine olanak tanır. Bu sistemler, sözlü komutlara yanıt vererek dikkat dağılmasını azaltır, çoklu görevleri destekler ve sürekli sürüşe odaklanmayı sağlar. 

Müşteri, işletmelerin müşterilerine inanılmaz konuşma deneyimleri sunmasını sağlayan sesli yapay zeka çözümleri sunan, konuşma zekasında dünya lideridir. Sesle etkinleştirilen sistemlerini markalı anahtar ifadelerle eğitmek için önde gelen otomotiv şirketleriyle çalışıyorlardı ve Shaip'in ses verisi toplama konusundaki uzmanlığına ihtiyaçları vardı.

Gerçek dünya çözümü
Zorluklar

Zorluklar

  • Kitle Kaynak Kullanımı: Dünya çapında her dil için 2800'den fazla ana dili İngilizce olan kişiyi işe alın.
  • Veri koleksiyonu: Belirlenen zaman aralığında 200 dilde 12'den fazla istemi güvenli hale getirin.
  • Bağlam ve Amaç Tanıma: Kullanıcı isteklerini doğru anlayabilmek için sistemlerin aynı anahtar kelime öbeğinin farklı varyasyonları üzerinde eğitilmesi gerekiyordu.
  • Arka Plan Gürültü İşleme: Makine öğrenimi modeli doğruluğu için gerçek dünyadaki arka plan gürültüsünü ele alın.
  • Önyargıyı Azaltma: Kapsayıcılığı sağlamak için çeşitli demografilerden ses örnekleri alın.
  • Ses Özellikleri: 16khz 16bit PCM, mono, tek kanallı, WAV; işleme yok.
  • Kayıt Ortamı: Kayıtlar, arka plan gürültüsü veya rahatsızlığı olmayan temiz bir sese sahip olmalıdır. Normal konuşma kullanılarak kaydedilecek Anahtar Sözcükler.
  • Kalite kontrolü:  Tüm konuşma kayıtları kalite değerlendirmesinden ve doğrulamasından geçecek, yalnızca doğrulanmış konuşma kayıtları teslim edilecektir. Shaip üzerinde anlaşmaya varılan Kalite Standartlarını karşılamıyorsa, Shaip verileri hiçbir ek ücret ödemeden yeniden iletecektir.

Çözüm

Sohbet Yapay Zekası alanındaki uzmanlığıyla Shaip, müşteriye şunları sağladı:

  • Veri koleksiyonu: Öngörülen zaman diliminde 208 konuşmacıdan 12 küresel dilde toplanan 2800 bin anahtar sözcük/marka istemi
  • Çeşitli Vurgular ve Lehçeler: Dünyanın dört bir yanından, istenen aksan ve lehçelerde yetkin uzmanlar işe alındı.
  • Bağlam ve Amaç Tanıma: Her konuşmacıya, ML modellerinin bağlam ve amaç açısından kullanıcı isteklerini doğru bir şekilde kavraması için anahtar ifadeleri 20 farklı varyasyonda kaydetme görevi verildi.
  • Arka Plan Gürültü İşleme: Bozulmamış ses kalitesi sağlamak için, anahtar ifadelerin, TV, radyo, müzik, konuşma veya sokak sesleri gibi arka planda parazitlerin bulunmadığı, 40dB'nin altında gürültü seviyelerine sahip sakin bir ortamda yakalandığından emin olduk.
  • Önyargıyı Azaltma: Önyargıyı en aza indirmek için, farklı bölgelerden bireyleri dahil ettik ve 50 ile 50 arasındaki yaş gruplarını kapsayan, %18 erkek ve %60 kadından oluşan dengeli bir demografik temsil sağladık.
  • Kayıt Yönergeleri: Anahtar ifadeler, hızlı veya yavaş ilerleme gibi herhangi bir değişiklik olmaksızın tutarlı, normal bir konuşma düzeninde yakalandı. Konuşmanın hiçbir bölümünün yanlışlıkla kesilmemesini garanti etmek için hem başında hem de sonunda 2 saniyelik sessizlik.
  • Kayıt Formu: Ses, tek bir kanal kullanılarak 16kHz, 16-bit PCM'de mono olarak kaydedildi ve WAV dosya formatında kaydedildi. Ses işlenmeden kalır, yani sıkıştırma, yankı veya EQ uygulaması yoktur.
  • Kalite: Her konuşma kaydı, titiz kalite kontrollerine ve doğrulamaya tabi tutuldu. Yalnızca bu değerlendirmeyi geçen kayıtlar teslim edildi. Kararlaştırılan kalite standartlarının altında kalan dosyalar yeniden kaydedildi ve herhangi bir ek ücret talep edilmeden sağlandı.
Çözüm
Sonuç

Sonuç

Yüksek kaliteli marka anahtar sözcük sesli verileri veya sesli yönlendirmeler, otomotiv şirketlerine ve müşterilerine aşağıdakileri sağlayacaktır:

  1. Markalaşma ve Kimlik: Spesifik, marka ifadesine sahip sesli komutlar, şirketlerin kullanıcı ile marka arasında marka hatırlanabilirliğini artıran doğrudan ve akılda kalıcı bir bağlantı kurmasına yardımcı olur.
  2. Kullanım kolaylığı: Sesli komutlar, sürücülerin ellerini direksiyondan veya gözlerini yoldan ayırmadan araçla etkileşimini kolaylaştırarak yol güvenliğini artırır.
  3. Fonksiyonellik: Sesli komutlar, araç özelliklerine erişimi ve kontrolü daha sezgisel hale getirir. Navigasyon, medya oynatma veya iklim kontrolü olsun.
  4. Diğer Sistemlerle Entegrasyon: Sesle etkinleştirilen birçok sistem akıllı telefonlar, akıllı ev cihazları ve diğer IoT cihazlarıyla entegredir. Örneğin, bir kullanıcı eve yaklaşırken arabasından evdeki ışıkları açmasını isteyebilir.
  5. Rekabet Avantajı: Gelişmiş sesle etkinleştirilen sistemler sunmak, bir satış noktası ve farklılaştırıcı olabilir. Alıcılar, yeni bir araba satın almayı düşünürken en son teknolojiyi ararlar.
  6. Geleceğe Yönelik: Teknoloji geliştikçe ve IoT günlük yaşama daha entegre hale geldikçe, sesle etkinleştirilen güçlü bir sisteme sahip olmak, otomotiv şirketlerini geleceğin teknolojisine daha uyumlu olacak şekilde konumlandırıyor.
  7. Gelir Fırsatları: Ek para kazanma fırsatları, örneğin ses sistemleri, bağlı kuruluş geliri sağlayabilecek öneriler veya entegre e-ticaret deneyimleri (yemek siparişi vermek veya yakındaki hizmetleri bulmak gibi) sunar.
Altın-5 yıldızlı

Otomotiv sektörü için sesli komutlar almaya başladığımızda, sayısız zorluk vardı. Konuşma, aksan ve tonlardaki çeşitliliği yakalamak, müşterimizin küresel müşterilerini temsil etmek için hayati önem taşıyordu. Shaip sadece bir satıcı olarak değil, gerçek bir ortak olarak öne çıktı. Farklı bölgelerden çok çeşitli sesleri güvence altına alma taahhütleri övgüye değerdi. Sadece ses toplamanın ötesine geçtiler; birinci sınıf kayıtları garanti ederek proje ihtiyaçlarımızın nüanslarını kavradılar. Ses toplama standartlarına kusursuz bağlılıkları, profesyonelliklerini ve projeye bağlılıklarını sergiledi.

Konuşma AI'nızı hızlandırın
%100 uygulama geliştirme