ASR için Sentetik Sağlık Konuşmaları

Sentetik Sağlık Hizmetleri Konuşmaları Yoluyla Ortam Teknolojisi Geliştirmeyi Etkinleştirme

Ortam teknolojisi

Klinik ortamda toplanan ve yazıya aktarılan 2000 saatten fazla ses verisi

Konuşmaya dayalı yapay zekanın hızla gelişen alanında, dikkate değer uygulamalardan biri, sağlayıcı-hasta etkileşimlerini kolaylaştırmak için teknolojinin kullanıldığı sağlık sektörüdür. Sağlık teknolojisinde lider bir isim olan müşterimiz, klinik ortamlarda çok konuşmacılı konuşmaları daha iyi anlamak ve yazıya geçirmek için Otomatik Konuşma Tanıma (ASR) modelini geliştirme talebiyle Shaip'e başvurdu. Gizlilik düzenlemeleri nedeniyle gerçek dünyadaki diyalogları edinmek zordu; dolayısıyla amaç, sağlık hizmeti sağlayıcıları ve hastalar arasında sentetik ama gerçekçi etkileşimler yaratmak ve bunları yazıya dökmekti.

hacim

2,000 saat veya yaklaşık olarak 12,000 için 24,000 bireysel sentetik etkileşimler 10 dakikalık ortalama süre.

Nesnel

Öncelikli hedefimiz, cinsiyet, yaş, aksan ve tıbbi roller açısından çeşitlilik içeren, titizlikle hazırlanmış 2,000 ila 12,000 sentetik etkileşime dönüşen yaklaşık 24,000 saatlik ses kaydı oluşturmaktı. Gerçek dünyadaki klinik diyalogları taklit etmek üzere tasarlanan bu kapsamlı ve özgün veri seti, HIPAA gibi gizlilik düzenlemelerine sıkı sıkıya bağlı kalarak oluşturuldu. Sentetik etkileşimler, müşterimizin ASR modelinin eğitilmesinde ve geliştirilmesinde etkili olan, klinik ortamlarda gerçek dünya konuşmalarını yönetme yeterliliğini önemli ölçüde artıran zengin bir veri kümesi görevi gördü.

 

Amacı

Zorluklar

Yasal Uygunluk

Gerçekçi ancak sentetik sağlık hizmeti etkileşimleri oluştururken HIPAA gibi gizlilik yasalarına bağlılığı sağlamak zor olabilir.

Mevzuata uygunluk

Veri Orijinalliği ve Çeşitliliği

Çok çeşitli senaryoları, aksanları, yaşları ve tıbbi rolleri kapsarken gerçek dünyadaki klinik diyalogları doğru bir şekilde taklit eden sentetik etkileşimler oluşturmak, titiz bir yaklaşım ve derin alan bilgisi gerektirir.

Veri özgünlüğü ve çeşitliliği

Kalite güvencesi

Hedeflenen %95 Kelime Doğruluk Oranı (WER) ve %90 Etiket Doğruluk Oranı (TER) gibi transkripsiyonda yüksek düzeyde doğruluk elde etmek, sıkı kalite güvence süreçlerini gerektirir.

Teknik yetenekler

Kayıt ve transkripsiyon platformları da dahil olmak üzere teknik altyapının veri hacmini yönetebilmesini ve kaliteyi koruyabilmesini sağlamak önemli bir zorluktur.

Kaynak İstihdamı ve Eğitimi

Rol yapma için tıbbi geçmişi olan kişileri işe almak ve doğal bir konuşma akışını sürdürürken gerçekçi senaryolara bağlı kalmalarını sağlamak oldukça zor olabilir. Ek olarak, transkripsiyon uzmanlarını katı kalite yönergelerine uyacak şekilde eğitmek önemli çaba ve uzmanlık gerektirir.

Yaklaşım/Çözüm

Ses Toplama ve Transkripsiyon

  • Senaryo Oluşturma: Yetişkin aile hekimliği uygulamalarında karşılaşılan hipertansiyon, diyabet ve ağrı yönetimi gibi yaygın acil olmayan durumları yansıtan gerçekçi senaryolar geliştirildi.
  • Rol yapma: Sağlanan senaryolara bağlı kalarak ve gerçek dünyadaki klinik konuşmaları simüle ederek sağlık hizmeti sağlayıcıları ve hastalar olarak rol oynamaları için tıbbi geçmişi olan bireyleri işe aldık.
  • Kayıt: Katılımcılar arasında cinsiyet, yaş, aksan ve mesleki geçmiş açısından çeşitliliğin temsil edilmesini sağlamak amacıyla ses yakalamak için Shaip Work Mobil Uygulaması kullanıldı.

Doğrulama ve Transkripsiyon

  • Ses dosyalarının doğruluğunu ve kalitesini sağlamak için doğrulama komut dosyaları yürütüldü.
  • Transkripsiyonlar, Bhasha platformunda, sağlanan belirli kurallara bağlı kalınarak ve hassas günlük tutma ile kelimesi kelimesine metin transkripsiyonunun sağlanmasıyla gerçekleştirildi.
  • Müşterinin model eğitimi amaçları açısından kritik olan Konuşmacı Kimliği, Yaş, Cinsiyet, Ana Dil ve tıbbi eğitim/deneyimi içeren açıklamalı meta veriler.

Kalite güvencesi

  • CQA ve PMO tarafından yapılan kapsamlı kalite kontrolleri, %95 Kelime Doğruluk Oranı (WER) ve %90 Etiket Doğruluk Oranı (TER) olan Transkripsiyon Kalitesi Hedefini garantiledi.

Veri Teslimatı

  • Verileri net, düzenli bir şekilde yapılandırdı ve ayrıntılı toplu notlar ve kültür dizinleriyle birlikte gruplar halinde teslim etti.
  • Ses dosyaları, transkripsiyonlar ve meta veriler dahil tüm verilerin müşterinin spesifikasyonlarına göre doğru bir şekilde etiketlendiğinden ve biçimlendirildiğinden emin olundu.

Geri Bildirim ve Yineleme

Herhangi bir eksikliği belirlemek, düzeltmelerin yapılmasını ve eksiksiz, doğru bir veri kümesinin teslim edilmesini sağlamak için müşteriyle güçlü bir geri bildirim döngüsü oluşturuldu.

Anahtar başarılar

  • 2000 saatlik sentetik sağlık hizmeti etkileşimlerinin başarılı bir şekilde toplanması ve transkripsiyonu.
  • Dikkat çekici bir doğruluk oranıyla hızlı ve doğru transkripsiyon, müşterinin ASR modelini geliştirme hedefine önemli ölçüde katkıda bulunur.
  • Shaip'in büyük ölçekli, karmaşık projeleri kalite ve doğruluğa yönelik titiz bir yaklaşımla ele alma becerisini gösterdi.

Sonuç

Shaip'in kolaylaştırıcılığını yaptığı titizlikle yürütülen proje, müşterinin ASR modelinin geliştirilmesine önemli ölçüde katkıda bulunan zengin bir veri kümesiyle sonuçlandı. Sentetik etkileşimler, klinik diyalogların gerçekçi bir temsilini oluşturarak müşterinin sağlık hizmetleri ortamları için daha sağlam ve güvenilir bir konuşma hizmeti elde etmesine yardımcı oldu. Shaip, yapılandırılmış ve iyi koordine edilmiş bir yaklaşımla, karmaşık bir projenin öngörülen zaman dilimi içinde başarılı bir şekilde teslim edilmesini sağlayarak sağlık alanında büyük ölçekli, konuşmaya dayalı yapay zeka projelerini yönetme konusundaki uzmanlığını güçlendirdi.

Shaip ile olan işbirliğimiz, sağlık hizmetleri kapsamında Ortam Teknolojisi ve Konuşmaya Dayalı Yapay Zeka alanındaki projemizi önemli ölçüde geliştirdi. Sentetik sağlık hizmetleri diyalogları oluşturma ve yazıya dökme konusundaki uzmanlıkları, sentetik verilerin düzenleyici zorlukların üstesinden gelme potansiyelini ortaya koyan sağlam bir temel sağladı. Shaip ile bu engelleri aştık ve artık sezgisel sağlık hizmetleri çözümleri vizyonumuzu gerçekleştirmeye bir adım daha yaklaştık.

Altın-5 yıldızlı

Sağlık Hizmeti Yapay Zekanızı hızlandırın
%100 uygulama geliştirme