Tayca Veri Kümesi

Gerçek şu ki

Yapay Zeka ve Konuşma Modelleri için Yüksek Kaliteli Tayca Genel Konuşma, Senaryo Yazılı Monolog ve Medya (Podcast) Veri Seti

Genel Bakış

Başlık (Dil)

Tay Dili Veri Seti

Veri Kümesi Türleri

Genel Sohbet, Medya (Podcast), Senaryolu Monolog

Ülke

Tayland

Açıklama

Bu veri seti, İsrail'den iki kişi arasında İbranice olarak gerçekleşen senaryosuz telefon görüşmelerini (15-60 dakika), 1 ila 5 katılımcının yer aldığı lisanslanabilir kamu malı ses veya video dosyalarını (15-60 dakika) ve tek bir konuşmacının konuşma ve dil modellerini eğitmek ve değerlendirmek için önceden tanımlanmış içerik sunduğu senaryolu monologları içermektedir.

Kullanım çantası

ASR, Sanal Asistan, Chatbot, Konuşmaya Dayalı Yapay Zeka, Konuşma Analizi, TTS, Dil Modelleme

Veri Kümesi Ayrıntıları

Veri Kümesi Türü Örnekleme oranı Konuşmacılar Telegram Kanal Toplam Saat Toplam Konuşmacı Sayısı
Genel Konuşma 8 kHz 2 Hoparlörler Çift 211:48:42 170
Medya Verileri 16 kHz Tek konuşmacı Mono 249:14:31 670
Senaryolu Monolog 24 kHz Tek konuşmacı Mono 500:00:00 İstek Üzerine

Öne Çıkan Müşteriler

Ekipleri, dünya lideri yapay zeka ürünleri oluşturmaya teşvik etmek.

Amazon
Google
Microsoft
Shaip bize ulaşın

Aradığınızı bulamıyor musunuz?

Tüm veri türlerinde kullanıma hazır yeni veri kümeleri toplanıyor

Ses/konuşma eğitimi veri toplama endişelerinizi gidermek için şimdi bize ulaşın

  • Bu alan doğrulama amaçlıdır ve değişmeden bırakılmalıdır.
  • Kaydolarak Shaip'e katılıyorum Gizlilik Politikası hem de Hizmet Şartları ve Shaip'ten B2B pazarlama iletişimi almak için onayımı verin.