Konuşma Duygu ve Duygu Analizi

Yapay Zeka Destekli İçgörülerle Daha Akıllı Çağrı Merkezlerini Etkinleştirme

Müşteri hizmetlerini iyileştirmek için gerçek zamanlı duygu ve his tespitini geliştirmek amacıyla Shaip'in ses verisi toplama ve açıklama konusundaki uzmanlığından yararlanılıyor.

Konuşma Duygu ve Duygu Analizi

Otomatik Konuşma Duygu ve Duygu Analizi

Müşteri, çağrı merkezleri için otomatik bir konuşma duygusu ve duygu analizi modeli geliştirmek üzere Shaip ile ortaklık kurdu. Proje, dört İngilizce lehçesi - ABD, İngiltere, Avustralya ve Hintçe - genelinde 250 saatlik çağrı merkezi ses verisinin toplanmasını ve açıklamasını içeriyordu. Bu, müşterinin Mutlu, Nötr ve Kızgın gibi duyguları ve Memnuniyetsiz ve Memnun gibi duyguları gerçek zamanlı müşteri etkileşimlerinde tespit etmek için AI modellerini geliştirmesini sağladı.

Proje, alaycılık tespiti, farklı ses uzunlukları ve memnuniyetsizliğin ince sözlü ipuçları gibi zorlukların üstesinden gelerek hassas ve ölçeklenebilir sonuçlar elde etti.

Otomatik Konuşma Duygu ve Duygu Analizi

Anahtar İstatistikler

Çağrı merkezi ses verileri 4 İngilizce lehçesinde toplandı ve açıklandı

250 Saat

Dil Sayısı

ABD İngilizcesi, İngiltere İngilizcesi, Avustralya İngilizcesi ve Hint İngilizcesi

Kullanım Senaryoları

Otomatik Konuşma Duygu ve Duygu Analizi

Proje kapsamı

Dört farklı İngilizce lehçesinde 250 saatlik çağrı merkezi ses verisini toplayın ve açıklamalar ekleyin:

  • ABD İngilizcesi (%30)
  • İngiltere İngilizcesi (%30)
  • Avustralya İngilizcesi (%20)
  • Hint İngilizcesi (%20)

Kapsam dahilinde

Proje üç bölümden oluşmaktadır:

  • Meta veriler de dahil olmak üzere belirli varlıklara sahip ses verileri.
  • Segmentasyon ve zaman damgası detaylarıyla birlikte karşılık gelen transkripsiyonlu dosyalar.
  • Duygu ve his açıklamaları:
    • Ses Duygusu: Mutlu, Nötr, Kızgın
    • Transkripsyon Duygusu: Son derece memnuniyetsiz, memnuniyetsiz, tarafsız, memnun, son derece memnun

Meydan Okumalar

Lehçelerin Çeşitliliği

Ses verilerinin belirtilen lehçeleri (ABD, İngiltere, Avustralya ve Hint) doğru bir şekilde temsil etmesini sağlamak zor olabilir. Bu kategorilerdeki farklı bölgeler farklı kelime dağarcığı, aksanlar ve telaffuzlar kullanabilir.

Uzmanlık Gereksinimi

Duygu ve hisleri dile getirmek için ses ve yazıya not düşmek, her lehçenin kültürel nüanslarını ve dilsel inceliklerini bilen eğitimli notçular gerektirir.

Duyguların ve Hislerin Karmaşıklığı

Ses duygusu ve transkripsiyon duygusu her zaman uyumlu değildir. Örneğin, bir kişi öfkeli görünebilir ancak aslında memnuniyet ifade edebilir. Örneğin, "Ah, harika, sorunumu çözemeyen bir kişi daha" gibi alaycı ifadelerle alaycı konuşmaları ele almak, duygu ve his için doğru şekilde ek açıklama yapılması gerekir.

Ses Kalitesi

Ses kayıtlarının kalitesi değişebilir ve bu da transkripsiyon doğruluğunu ve duygu algılamayı etkileyebilir. Arka plan gürültüsü, üst üste gelen konuşmalar ve farklı kayıt ekipmanları önemli zorluklara yol açabilir.

Doğru Yakalama

Ağır nefes verme veya diğer hayal kırıklığı belirtileri gibi sözlü ipuçlarıyla tatminsizlik.

Çözüm

Gelişmiş doğal dil işleme (NLP) tekniklerinden yararlanılarak aşağıdaki çözümler uygulandı:

Veri koleksiyonu

  • 250 saatlik ses verisi lehçelere özgü kotalara bölünmüştür.
    • ABD İngilizcesi (%30 veya 75 saat)
    • İngiltere İngilizcesi (%30 veya 75 saat)
    • Avustralya İngilizcesi (%20 veya 50 saat)
    • Hint İngilizcesi (%20 veya 50 saat)
  • ABD, İngiltere, Avustralya ve Hindistan'dan anadil aksanıyla konuşan kullanıcılar.
  • Farklı tonlar içeren konuşma örnekleri, özellikle ses duygusunun Öfkeli ve metin duygusunun Memnuniyetsiz veya Son Derece Memnuniyetsiz olduğu durumlara odaklanılmıştır.

Metin Sınıflandırması/Açıklaması

Metin Sınıflandırması

  • Belirli kategorilere dayalı duygu ve düşüncelerin açıklanması:
    • Ses Duygusu: Mutlu, Nötr, Kızgın.
    • Transkripsyon Duygusu: Son derece memnuniyetsiz, memnuniyetsiz, tarafsız, memnun, son derece memnun.
  • Her ses parçası yalnızca bir birincil duyguyu içeriyordu.
  • Konuşmalarda değişen gecikme segmentleri (2 ila 30 saniye arasında) uygulandı.
  • Transkript formatı, sol ve sağ konuşmacı bilgileri, duygu etiketleri ve son segment duygusunu içeren JSON çıktısını takip etti.

 

Kalite güvencesi

Kalite güvencesi
Transkripsiyon Doğruluğu:

  • En azından aşağıdakilerle 250 saatlik sesin teslim edilmesini sağladık:
    • %90 Transkripsiyon Hata Oranı (TER) doğruluğu.
    • %95 Kelime Tanıma Oranı (WER) doğruluğu.

QA Süreci:

  • Veri setinden rastgele seçilen örnekler üzerinde düzenli denetimler yapıldı.
    • Veri kümesi genelinde TER ve WER'i ölçmek için otomatik araçlar kullanıldı.
    • İşaretlenen bölümlerin manuel olarak incelenmesi doğruluk eşiklerinin karşılanmasını sağladı.

Sonuç

Eğitim verileri, otomatik bir duygu ve his algılama modelinin geliştirilmesini destekleyecek ve şunları sağlayacaktır:

  • Çağrı merkezi etkileşimlerinde gerçek zamanlı duygu tespiti.
  • Alaycılık veya memnuniyetsizlik gibi karmaşık durumların daha etkili bir şekilde ele alınması.
  • Gelecekteki projeler için ölçeklenebilirlik, artan veri hacimlerine ve daha fazla dile kolayca uyum sağlama.

Teslim

  • 250 saatlik Ses dosyaları (8 kHz PCM WAV formatında, mono)
  • Transkript dosyaları (segmentasyon, duygu etiketleri ve konuşmacı tanımlayıcıları ile)
  • Meta veriler (ses süresi, konuşmacı bilgileri, vb.)

Çağrı merkezi veri projemiz için Shaip ile ortaklık kurmak, AI çözümlerimizi ilerletmede önemli bir an oldu. Ekipleri, ABD, İngiltere, Avustralya ve Hint olmak üzere dört temel İngilizce lehçesinde 250 saatlik ses verisini uzmanca topladı ve açıkladı; bu da en yüksek kalite ve hassasiyeti garantiledi. Bu bölgelerdeki dilsel nüanslara gösterilen dikkat, konuşma tanıma modellerimizin doğruluğunu önemli ölçüde artırdı. Ayrıca, Shaip'in karmaşık veri açıklama projelerini ele alma konusundaki uzmanlığı, ölçekte güvenilir, uyumlu modeller oluşturmamıza yardımcı olmakta etkili oldu.

Altın-5 Yıldızlı