Vaka Çalışması: Tıbbi Veri Seti Lisanslaması
Hassas Veri Toplama ve Açıklama Eğitimi ile Pediatrik ve Kadın Hastalıkları ve Doğum Bakımının Dönüşümü
Tıbbi Verilerin Gücünün Kilidini Açmak: Üstün Yapay Zeka Modeli Eğitimi için Kapsamlı Veri Toplama, Kimlik Gizleme, ICD-10 CM ve Açıklama.
Projeye Genel Bakış
Shaip, gelişmiş NLP modellerini eğitmek için yüksek kaliteli, kimliği belirsiz tıbbi veri kümelerini düzenlemek ve açıklama eklemek üzere önde gelen bir sağlık hizmeti AI şirketiyle ortaklık kurdu. Proje, sağlam bir API çerçevesi aracılığıyla ICD-10 CM kodlarıyla açıklamalı ayakta tedavi kayıtları sunan Pediatri ve OB-GYN uzmanlıklarına odaklandı.
Veri seti, yapay zekanın gerçek dünya sağlık dokümantasyonu konusunda eğitimini kolaylaştırmak ve klinik anlatıları anlamada model yeteneğini geliştirmek üzere yapılandırılmıştır.
Anahtar İstatistikler
750 sayfaları / ~300 ayakta tedavi kaydı
375 sayfa Pediatri
375 sayfa Kadın Hastalıkları ve Doğum
ICD-10 CM 2023 tıbbi kod açıklamaları
Proje kapsamı
| Veri Kümesi Türü | Uzmanlık | hacim | Meta Veri Yakalandı | notlar |
|---|---|---|---|---|
| Tıbbi Notlar | Pediatri | 375 sayfa (~150 kayıt) |
Dosya Adı, Uzmanlık, Belge Türü, Hasta Sınıfı (Ayakta Tedavi) |
Değerlendirme / Plan bölümlerini içerir |
| kadın doğum uzmanı | 375 sayfa (~150 kayıt) | |||
| Açıklamalar | ICD-10 CM (2023) | Tam Veri Seti | API aracılığıyla Kod Eşleme | Kodlayıcılar tarafından kod doğrulaması kapsam dışıdır |
Meydan Okumalar
Proje, titiz planlama ve uygulama gerektiren birkaç kritik zorluğu beraberinde getirdi:
1. Uzmanlık Alanına Özel Veri Toplama
Yalnızca Pediatri ve Kadın Hastalıkları ve Doğum uzmanlıklarından yüksek kaliteli ayakta tedavi kayıtları temin etmek zordu. Her belgenin doğru açıklamaları desteklemek için Değerlendirme ve Plan gibi temel klinik bölümleri içermesi gerekiyordu.
2. Kapsamlı PHI Kimlik Gizleme
Tıbbi bağlamı korurken tüm kişisel olarak tanımlanabilir bilgilerin (PII) tamamen kaldırılmasını sağlamak HIPAA uyumluluğu için elzemdi. Bu, herhangi bir gizlilik ihlalini önlemek için ayrıntılı incelemeler gerektiriyordu.
3. Karmaşık ICD-10 CM Açıklaması
API aracılığıyla hassas ICD-10 CM (2023) kodlarının uygulanması, çeşitli anlatım stilleri ve tıbbi terminoloji nedeniyle karmaşıktı. Güvenilir AI modeli eğitiminin sağlanması için kodlamada tutarlılık ve doğruluk kritik öneme sahipti.
4. Meta Veri Doğruluğu ve Tutarlılığı
Uzmanlık, belge türü ve hasta sınıfı gibi meta verileri tutarsızlıklar olmadan yakalamak ve doğrulamak hayati önem taşıyordu. Herhangi bir uyumsuzluk model eğitimini ve veri kullanılabilirliğini etkileyebilir.
5. Sıkı Dış Hasta Filtrelemesi
Tüm kayıtların kesinlikle ayaktan hastalara ait olmasını sağlamak karmaşıklığı artırdı; çünkü birçok klinik belgede karışık hasta sınıfları veya eksik bölümler bulunabilir.
6. Kalite Güvence ve Doğruluk Standartları
%90 doğruluk eşiğine ulaşmak, tekrarları ortadan kaldırmak, uzmanlık uyumunu doğrulamak ve kimlik gizlemeyi sağlamak için çok seviyeli incelemeler gerektiriyordu; gerektiğinde yeniden çalışma için hükümler de vardı.
Çözüm
Kapsamlı Veri Lisanslama ve Açıklama
- Lisanslı pediatrik ve OB-GYN ayaktan hasta kayıtları
- Kritik bölümlerin dahil edilmesi sağlandı: Baş Şikayet, Geçmiş, ROS, Değerlendirme, Plan
- API tabanlı ICD-10 CM açıklaması (2023 sürümü)
Kimlik Gizleme ve Uyumluluk
- PHI yer tutucularla değiştirildi (KİŞİ_ADI, TARİH, KONUM, vb.)
- Sağlık veri gizliliği standartlarına uyumun sağlanması
Meta Veri Etiketleme
- Dosya başına yakalanan ayrıntılı meta veriler:
-
- Dosya Adı
- Uzmanlık (Pediatri veya Kadın Hastalıkları ve Doğum)
- Belge Türü (Takip, Sağlık ve Bakım, Danışma)
- Hasta Sınıfı (Sadece Ayaktan Hasta)
Kalite kontrol
- Aşağıdakilerle titiz kalite değerlendirmeleri:
- Yinelenen kayıt yok
- Özel eşleşme doğrulaması
- Sadece ayakta tedavi kontrolü
- Meta veri tutarlılık kontrolü
- %90 doğruluk eşiğinin altındaki kayıtların değiştirilmesi veya düzeltilmesi
Sonuç
Shaip, müşterinin şunları yapmasına olanak tanıyan yapılandırılmış, açıklamalı bir tıbbi not veri seti sundu:
- Doğru ICD-10 CM kod tahmini için AI modellerini eğitin
- Gerçek dünya sağlık senaryolarında NLP yeteneklerini geliştirin
- Gizlilik ve düzenleyici standartlara uyumu koruyun
- Pediatri ve OB-GYN alanlarında sağlık hizmeti AI modellerini ölçeklendirin
Shaip'in veri kümesi düzenleme ve açıklama konusundaki yapılandırılmış yaklaşımı beklentilerimizi aştı. Doğruluk, kimliksizleştirme ve meta veri hassasiyeti, AI model eğitim hattımızı önemli ölçüde güçlendirdi.