Kannada Veri Kümesi

ಕನ್ನಡ ಡೇಟಾಸೆಟ್

Yapay Zeka ve Konuşma Modelleri için Yüksek Kaliteli Kannada Çağrı Merkezi, Genel Konuşma, Senaryo Yazılı Monolog ve Medya (Podcast) Veri Seti

Genel Bakış

Başlık (Dil)

Kannada Dil Veri Seti

Veri Kümesi Türleri

Çağrı Merkezi, Genel Konuşma, Medya Verileri, Senaryo Monolog

Ülke

Hindistan

Tanım

Bu veri seti, senaryosuz sentetik ajan-müşteri telefon görüşmeleri (5-15 dakika), 1 ila 5 katılımcılı röportajlar ve podcast'ler gibi lisanslanabilir kamuya açık ses veya video dosyaları (15-60 dakika) ve konuşma ve dil modellerini eğitmek ve değerlendirmek için tek bir konuşmacının önceden tanımlanmış içerik sunduğu senaryolu monologları içerir.

Kullanım çantası

ASR, Sanal Asistan, Chatbot, Konuşmaya Dayalı Yapay Zeka, Konuşma Analizi, TTS, Dil Modelleme

Veri Kümesi Ayrıntıları

Veri Kümesi Türü Örnekleme oranı Konuşmacılar Telegram Kanal Toplam Saat Toplam Konuşmacı Sayısı
Çağrı Merkezi 8 kHz 2 Hoparlörler Çift 59:57:02 494
Çağrı Merkezi 16 kHz 2 Hoparlörler Mono 195:26:56 9,504
Genel Konuşma 8 kHz 2 Hoparlörler Çift 141:27:15 424
Medya Verileri 16 kHz Çoklu Konuşmacılar Mono 14:19:52 124
Senaryolu Monolog 24 kHz Tek konuşmacı Mono 500:00:00 İstek Üzerine

Öne Çıkan Müşteriler

Ekipleri, dünya lideri yapay zeka ürünleri oluşturmaya teşvik etmek.

Amazon
Google
Microsoft
Shaip bize ulaşın

Aradığınızı bulamıyor musunuz?

Tüm veri türlerinde kullanıma hazır yeni veri kümeleri toplanıyor

Ses/konuşma eğitimi veri toplama endişelerinizi gidermek için şimdi bize ulaşın

  • Bu alan doğrulama amaçlıdır ve değişmeden bırakılmalıdır.
  • Kaydolarak Shaip'e katılıyorum Gizlilik Politikası ve Hizmet Şartları ve Shaip'ten B2B pazarlama iletişimi almak için onayımı verin.