Vaka Çalışması: Tıbbi Veri Seti Lisanslaması

Hassas Veri Toplama ve Açıklama Eğitimi ile Pediatrik ve Kadın Hastalıkları ve Doğum Bakımının Dönüşümü

Tıbbi Verilerin Gücünün Kilidini Açmak: Üstün Yapay Zeka Modeli Eğitimi için Kapsamlı Veri Toplama, Kimlik Gizleme, ICD-10 CM ve Açıklama.

Tıbbi Veri Seti Lisanslaması

Projeye Genel Bakış

Shaip, gelişmiş NLP modellerini eğitmek için yüksek kaliteli, kimliği belirsiz tıbbi veri kümelerini düzenlemek ve açıklama eklemek üzere önde gelen bir sağlık hizmeti AI şirketiyle ortaklık kurdu. Proje, sağlam bir API çerçevesi aracılığıyla ICD-10 CM kodlarıyla açıklamalı ayakta tedavi kayıtları sunan Pediatri ve OB-GYN uzmanlıklarına odaklandı.

Veri seti, yapay zekanın gerçek dünya sağlık dokümantasyonu konusunda eğitimini kolaylaştırmak ve klinik anlatıları anlamada model yeteneğini geliştirmek üzere yapılandırılmıştır.

Tıbbi Veri Seti Lisanslaması

Anahtar İstatistikler

750 sayfaları / ~300 ayakta tedavi kaydı

375 sayfa Pediatri

375 sayfa Kadın Hastalıkları ve Doğum

ICD-10 CM 2023 tıbbi kod açıklamaları

Proje kapsamı

Veri Kümesi Türü Uzmanlık hacim Meta Veri Yakalandı notlar
Tıbbi Notlar Pediatri 375 sayfa (~150 kayıt) Dosya Adı, Uzmanlık,
Belge Türü, Hasta Sınıfı (Ayakta Tedavi)
Değerlendirme / Plan bölümlerini içerir
kadın doğum uzmanı 375 sayfa (~150 kayıt)
Açıklamalar ICD-10 CM (2023) Tam Veri Seti API aracılığıyla Kod Eşleme Kodlayıcılar tarafından kod doğrulaması kapsam dışıdır

Meydan Okumalar

Proje, titiz planlama ve uygulama gerektiren birkaç kritik zorluğu beraberinde getirdi:

1. Uzmanlık Alanına Özel Veri Toplama

Yalnızca Pediatri ve Kadın Hastalıkları ve Doğum uzmanlıklarından yüksek kaliteli ayakta tedavi kayıtları temin etmek zordu. Her belgenin doğru açıklamaları desteklemek için Değerlendirme ve Plan gibi temel klinik bölümleri içermesi gerekiyordu.

2. Kapsamlı PHI Kimlik Gizleme

Tıbbi bağlamı korurken tüm kişisel olarak tanımlanabilir bilgilerin (PII) tamamen kaldırılmasını sağlamak HIPAA uyumluluğu için elzemdi. Bu, herhangi bir gizlilik ihlalini önlemek için ayrıntılı incelemeler gerektiriyordu.

3. Karmaşık ICD-10 CM Açıklaması

API aracılığıyla hassas ICD-10 CM (2023) kodlarının uygulanması, çeşitli anlatım stilleri ve tıbbi terminoloji nedeniyle karmaşıktı. Güvenilir AI modeli eğitiminin sağlanması için kodlamada tutarlılık ve doğruluk kritik öneme sahipti.

4. Meta Veri Doğruluğu ve Tutarlılığı

Uzmanlık, belge türü ve hasta sınıfı gibi meta verileri tutarsızlıklar olmadan yakalamak ve doğrulamak hayati önem taşıyordu. Herhangi bir uyumsuzluk model eğitimini ve veri kullanılabilirliğini etkileyebilir.

5. Sıkı Dış Hasta Filtrelemesi

Tüm kayıtların kesinlikle ayaktan hastalara ait olmasını sağlamak karmaşıklığı artırdı; çünkü birçok klinik belgede karışık hasta sınıfları veya eksik bölümler bulunabilir.

6. Kalite Güvence ve Doğruluk Standartları

%90 doğruluk eşiğine ulaşmak, tekrarları ortadan kaldırmak, uzmanlık uyumunu doğrulamak ve kimlik gizlemeyi sağlamak için çok seviyeli incelemeler gerektiriyordu; gerektiğinde yeniden çalışma için hükümler de vardı.

Çözüm

Kapsamlı Veri Lisanslama ve Açıklama

  • Lisanslı pediatrik ve OB-GYN ayaktan hasta kayıtları
  • Kritik bölümlerin dahil edilmesi sağlandı: Baş Şikayet, Geçmiş, ROS, Değerlendirme, Plan
  • API tabanlı ICD-10 CM açıklaması (2023 sürümü)

Kimlik Gizleme ve Uyumluluk

  • PHI yer tutucularla değiştirildi (KİŞİ_ADI, TARİH, KONUM, vb.)
  • Sağlık veri gizliliği standartlarına uyumun sağlanması

Meta Veri Etiketleme

  • Dosya başına yakalanan ayrıntılı meta veriler:
    • Dosya Adı
    • Uzmanlık (Pediatri veya Kadın Hastalıkları ve Doğum)
    • Belge Türü (Takip, Sağlık ve Bakım, Danışma)
    • Hasta Sınıfı (Sadece Ayaktan Hasta)

Kalite kontrol

  • Aşağıdakilerle titiz kalite değerlendirmeleri:
    • Yinelenen kayıt yok
    • Özel eşleşme doğrulaması
    • Sadece ayakta tedavi kontrolü
    • Meta veri tutarlılık kontrolü
  • %90 doğruluk eşiğinin altındaki kayıtların değiştirilmesi veya düzeltilmesi

Sonuç

Shaip, müşterinin şunları yapmasına olanak tanıyan yapılandırılmış, açıklamalı bir tıbbi not veri seti sundu:

  • Doğru ICD-10 CM kod tahmini için AI modellerini eğitin
  • Gerçek dünya sağlık senaryolarında NLP yeteneklerini geliştirin
  • Gizlilik ve düzenleyici standartlara uyumu koruyun
  • Pediatri ve OB-GYN alanlarında sağlık hizmeti AI modellerini ölçeklendirin

Shaip'in veri kümesi düzenleme ve açıklama konusundaki yapılandırılmış yaklaşımı beklentilerimizi aştı. Doğruluk, kimliksizleştirme ve meta veri hassasiyeti, AI model eğitim hattımızı önemli ölçüde güçlendirdi.

Altın-5 Yıldızlı