Lehçe Veri Kümesi
Lehçe Veri Kümesi
Yapay Zeka ve Konuşma Modelleri için Yüksek Kaliteli Polonya Medya Verileri ve Yazılı Monolog
Genel Bakış
Başlık (Dil)
Lehçe Dil Veri Seti
Veri Kümesi Türleri
Medya (Podcast), Senaryolu Monolog
Ülke
Polonya
Tanım
Bu veri seti, 1 ila 5 katılımcının (15-60 dakika) yer aldığı röportajlar ve podcast'ler gibi lisanslanabilir kamuya açık ses veya video dosyalarının yanı sıra, konuşma ve dil modellerinin eğitimi ve değerlendirilmesi için önceden tanımlanmış içeriği tek bir konuşmacının sunduğu senaryolu monologları içerir.
Kullanım çantası
ASR, Sanal Asistan, Chatbot, Konuşmaya Dayalı Yapay Zeka, Konuşma Analizi, TTS, Dil Modelleme
Veri Kümesi Ayrıntıları
| Veri Kümesi Türü | Örnekleme oranı | Konuşmacılar | Telegram Kanal | Toplam Saat | Toplam Konuşmacı Sayısı |
|---|---|---|---|---|---|
| Medya Verileri | 16 kHz | Çoklu Konuşmacılar | Mono | 268:56:51 | 532 |
| Senaryolu Monolog | 48 kHz | Tek konuşmacı | Mono | 2,348:00:00 | 2,699 |
Öne Çıkan Müşteriler
Ekipleri, dünya lideri yapay zeka ürünleri oluşturmaya teşvik etmek.
Aradığınızı bulamıyor musunuz?
Tüm veri türlerinde kullanıma hazır yeni veri kümeleri toplanıyor
Ses/konuşma eğitimi veri toplama endişelerinizi gidermek için şimdi bize ulaşın