Veri Açıklaması – NER

Klinik NLP için Adlandırılmış Varlık Tanıma (NER) Açıklaması

Ner ek açıklaması

Sağlık Hizmeti API'sinin bir sonraki sürümünü oluşturmak üzere klinik NLP'yi eğitmek/geliştirmek için İyi Açıklamalı ve Altın Standart klinik metin verileri

Klinik Doğal Dil İşlemenin (NLP) önemi geçtiğimiz yıllarda giderek daha fazla kabul görmüş ve dönüştürücü ilerlemelere yol açmıştır. Klinik NLP, bilgisayarların, bir doktorun bir hastayla ilgili yazılı analizinin arkasında yatan zengin anlamı anlamasını sağlar. Klinik NLP'nin, nüfus sağlığı analitiğinden klinik dokümantasyondaki iyileştirmeye, konuşma tanımaya, klinik deneme eşleştirmeye vb. kadar çok sayıda kullanım durumu olabilir.

Herhangi bir klinik NLP modelini geliştirmek ve eğitmek için çok büyük hacimlerde doğru, tarafsız ve iyi açıklamalı veri kümelerine ihtiyacınız vardır. Gold Standard ve çeşitli veriler, NLP motorlarının hassasiyetini ve geri çağrılmasını artırmaya yardımcı olur.

hacim

Açıklamalı Belge Sayısı
10
Açıklamalı Sayfa Sayısı
10 +
Proje süresi
< 1 ay

Zorluklar

Müşteri, Doğal Dil İşleme (NLP) Platformunu yeni varlık türleriyle eğitmeyi ve geliştirmeyi ve aynı zamanda çeşitli türler arasındaki ilişkiyi tanımlamayı sabırsızlıkla bekliyordu. Dahası, yüksek doğruluk sunan, yerel yasalara uyan ve geniş bir veri kümesine açıklama eklemek için gerekli tıbbi bilgiye sahip olan satıcıları değerlendiriyorlardı.

Görev, yatan hasta ve ayakta tedavi elektronik sağlık kaydı (EHR) verilerinden 20,000'e kadar Etiketli Kayıt dahil olmak üzere 15,000'e kadar Etiketli Kaydı ve yazılı tıbbi diktelerden 5,000'e kadar Etiketli Kayıt'ı (1) coğrafi kökenlere ve ( 2) mevcut tıbbi uzmanlıklar.

Dolayısıyla zorlukları özetlemek gerekirse:

  • NLP Platformunu eğitmek için heterojen klinik verileri düzenleyin
  • Kritik bilgileri elde etmek için farklı varlıklar arasındaki ilişkiyi tanımlayın
  • Çok çeşitli karmaşık klinik belgeleri etiketleme/açıklama ekleme becerisi ve uzmanlığı
  • Öngörülen zaman çerçevesinde klinik NLP'yi eğitmek amacıyla büyük miktarda veriyi etiketlemek/açıklama eklemek için maliyeti kontrol altında tutmak
  • %75 EHR ve %25 Dikte kayıtlarından oluşan klinik veri kümesindeki varlıklara açıklama ekleyin.
  • Teslimat sırasında Verilerin Kimliksizleştirilmesi

Doğal Dili Anlamadaki Diğer Zorluklar

Belirsizlik

Kelimeler benzersizdir ancak bağlama bağlı olarak farklı anlamlara sahip olabilir ve bu da sözcüksel, sözdizimsel ve anlamsal düzeylerde belirsizliğe neden olur.

Eş anlamlılık

Aynı düşünceyi aynı zamanda eşanlamlı olan farklı terimlerle de ifade edebiliriz: Bir nesneyi tanımlarken büyük ve büyük aynı anlama gelir.

Çekirdek referans

Bir metinde aynı varlığa gönderme yapan tüm ifadeleri bulma işlemine çekirdek referans çözümlemesi denir.

Kişilik, Niyet, Duygular

Konuşmacının kişiliğine bağlı olarak niyetleri ve duyguları aynı fikir için farklı şekilde ifade edilebilir.

Çözüm

Tıbbi belgeler biçiminde büyük miktarda tıbbi veri ve bilgi mevcuttur, ancak bunlar çoğunlukla yapılandırılmamış bir formattadır. Tıbbi Varlık Ek Açıklaması / Adlandırılmış Varlık Tanıma (NER) Ek Açıklaması ile Shaip, çeşitli klinik kayıt türlerinden yararlı bilgilere açıklama ekleyerek yapılandırılmamış verileri yapılandırılmış bir formata dönüştürmeyi başardı. Varlıklar tanımlandıktan sonra, kritik bilgileri tanımlamak için aralarındaki ilişki de haritalandı.

İşin Kapsamı: Sağlık Kurumu Mansiyon Şerhi

9 Varlık Türü

  • Tıbbi durum
  • Tıbbi prosedür
  • Anatomik Yapı
  • Tıp
  • Tıbbi cihaz
  • Vücut Ölçümleri
  • Madde Bağımlılığı
  • laboratuvar verileri
  • vücut fonksiyonu

17 Değiştirici

  • İlaç Değiştiriciler: Güç, Birim, Doz, Kaynak, Sıklık, Yol, Süre, Durum
  • Vücut Ölçümü Değiştiricileri: Değer, Birim, Sonuç
  • Prosedür Değiştiriciler: Yöntem
    • Laboratuvar Veri Değiştiricisi: Laboratuvar Değeri, Laboratuvar Birimi, Laboratuvar Sonucu
  • Şiddet
  • Prosedür sonucu

27 İlişkiler ve Hasta Durumu

Sonuç

Açıklamalı veriler, Müşterinin Sağlık Hizmetleri API'sinin bir sonraki sürümüne dahil edilecek olan klinik NLP Platformunu geliştirmek ve eğitmek için kullanılacaktır. Müşterinin elde ettiği faydalar şunlardı:

  • Etiketlenen/açıklama eklenen veriler, Müşterinin standart veri açıklaması yönergelerine uygundur.
  • NLP Platformunu daha fazla doğruluk için eğitmek amacıyla heterojen veri kümeleri kullanıldı.
  • Farklı varlıklar arasındaki ilişkiler, yani Anatomik vücut yapısı <> Tıbbi Cihaz, Tıbbi Durum <> Tıbbi Cihaz, Tıbbi Durum <> İlaç, Tıbbi Durum <> Kritik tıbbi bilgilerin elde edilmesi için prosedür belirlendi.
  • Etiketlenen/açıklama eklenen geniş veri kümesinin kimlik bilgileri de teslimat sırasında kaldırılmıştır.

Shaip ile olan işbirliğimiz, sağlık hizmetleri kapsamında Ortam Teknolojisi ve Konuşmaya Dayalı Yapay Zeka alanındaki projemizi önemli ölçüde geliştirdi. Sentetik sağlık hizmetleri diyalogları oluşturma ve yazıya dökme konusundaki uzmanlıkları, sentetik verilerin düzenleyici zorlukların üstesinden gelme potansiyelini ortaya koyan sağlam bir temel sağladı. Shaip ile bu engelleri aştık ve artık sezgisel sağlık hizmetleri çözümleri vizyonumuzu gerçekleştirmeye bir adım daha yaklaştık.

Altın-5 yıldızlı

Konuşma AI'nızı hızlandırın
%100 uygulama geliştirme