Lehçe Veri Kümesi

Lehçe Veri Kümesi

Yapay Zeka ve Konuşma Modelleri için Yüksek Kaliteli Polonya Medya Verileri ve Yazılı Monolog

Genel Bakış

Başlık (Dil)

Lehçe Dil Veri Seti

Veri Kümesi Türleri

Medya (Podcast), Senaryolu Monolog

Ülke

Polonya

Tanım

Bu veri seti, 1 ila 5 katılımcının (15-60 dakika) yer aldığı röportajlar ve podcast'ler gibi lisanslanabilir kamuya açık ses veya video dosyalarının yanı sıra, konuşma ve dil modellerinin eğitimi ve değerlendirilmesi için önceden tanımlanmış içeriği tek bir konuşmacının sunduğu senaryolu monologları içerir.

Kullanım çantası

ASR, Sanal Asistan, Chatbot, Konuşmaya Dayalı Yapay Zeka, Konuşma Analizi, TTS, Dil Modelleme

Veri Kümesi Ayrıntıları

Veri Kümesi Türü Örnekleme oranı Konuşmacılar Telegram Kanal Toplam Saat Toplam Konuşmacı Sayısı
Medya Verileri 16 kHz Çoklu Konuşmacılar Mono 268:56:51 532
Senaryolu Monolog 48 kHz Tek konuşmacı Mono 2,348:00:00 2,699

Öne Çıkan Müşteriler

Ekipleri, dünya lideri yapay zeka ürünleri oluşturmaya teşvik etmek.

Amazon
Google
Microsoft
Shaip bize ulaşın

Aradığınızı bulamıyor musunuz?

Tüm veri türlerinde kullanıma hazır yeni veri kümeleri toplanıyor

Ses/konuşma eğitimi veri toplama endişelerinizi gidermek için şimdi bize ulaşın

  • Bu alan doğrulama amaçlıdır ve değişmeden bırakılmalıdır.
  • Kaydolarak Shaip'e katılıyorum Gizlilik Politikası ve Hizmet Şartları ve Shaip'ten B2B pazarlama iletişimi almak için onayımı verin.