Kore Veri Kümesi

한국어 데이터셋

Yapay Zeka ve Konuşma Modelleri için Yüksek Kaliteli Korece Çağrı Merkezi, Senaryo Yazılı Monolog ve Medya (Podcast) Veri Seti

Genel Bakış

Başlık (Dil)

Kore Dili Veri Kümesi

Veri Kümesi Türleri

Çağrı Merkezi, Medya Verileri, Senaryolu Monolog

Ülke

Güney Kore

Açıklama

Bu veri seti, senaryosuz sentetik ajan-müşteri telefon görüşmeleri (5-15 dakika), 1 ila 5 katılımcılı röportajlar ve podcast'ler gibi lisanslanabilir kamuya açık ses/görüntü dosyaları (15-60 dakika) ve konuşma ve dil modeli eğitimi için önceden tanımlanmış içerik sunan tek bir konuşmacının yer aldığı senaryolu monologları içerir.

Kullanım çantası

ASR, Sanal Asistan, Chatbot, Konuşmaya Dayalı Yapay Zeka, Konuşma Analizi, TTS, Dil Modelleme

Veri Kümesi Ayrıntıları

Veri Kümesi Türü Örnekleme oranı Konuşmacılar Telegram Kanal Toplam Saat Toplam Konuşmacı Sayısı
Çağrı Merkezi 8 kHz 2 Hoparlörler Çift 102:27:55 1,244
Medya Verileri 16 kHz Çoklu Konuşmacılar Mono 203:46:54 397
Senaryolu Monolog 24 kHz Tek konuşmacı Mono 500:00:00 İstek Üzerine
Senaryolu Monolog 48 kHz Tek konuşmacı Mono 1,955:00:00 İstek Üzerine

Öne Çıkan Müşteriler

Ekipleri, dünya lideri yapay zeka ürünleri oluşturmaya teşvik etmek.

Amazon
Google
Microsoft
Shaip bize ulaşın

Aradığınızı bulamıyor musunuz?

Tüm veri türlerinde kullanıma hazır yeni veri kümeleri toplanıyor

Ses/konuşma eğitimi veri toplama endişelerinizi gidermek için şimdi bize ulaşın

  • Bu alan doğrulama amaçlıdır ve değişmeden bırakılmalıdır.
  • Kaydolarak Shaip'e katılıyorum Gizlilik Politikası ve Hizmet Şartları ve Shaip'ten B2B pazarlama iletişimi almak için onayımı verin.