Güvenilir demografik tabanlı hasta eşleştirmesi için önerilen minimum eşleştirme kriterleri nelerdir?


30

Hastaları demografik verilere göre eşleştirirken, hastanın "Aynı Hasta" olması için hangi alanlarla eşleşmesi gerektiği konusunda herhangi bir tavsiye var mı?

Algoritmaların farklı uygulamalar için farklı olacağını biliyorum, bu süreçte en iyi uygulamalar veya öneriler olup olmadığını merak ediyorum.

First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip

vb?


4
Muhtemelen bu sorunun cevabı, ülkeye ve hatta etnik ve kültürel konulara bağlı olarak değişebilir. Örneğin, bir kişinin adı, Avustralya aborjinleri için iyi bir hasta tanımlayıcısı olmayabilir (veya durumlarında daha düşük bir "ağırlık" verilmelidir) çünkü zaman içinde adını değiştirebilirler. Ölen biriyle aynı adı taşıyan Avustralya yerlileri, ölen birinin aynı ismini taşımanın çok kötü olduğunu düşündüğü için onu terk eder. Diğer kültürlerde de benzer bir şey olur ölülerin adı tabudur. link

4
Veya henüz yayınlanmamış bir çalışmadan başka bir örnek: ABD'ye Filipinli göçmenlerde, en yaygın on soyadı, tüm insanların yaklaşık% 6'sını oluşturuyor. Vietnamlı göçmenlerde, ~% 60'ını oluşturuyorlar. İsimler Filipinlilerde Vietnamlılardan daha iyi bir tanımlayıcıdır. Bu çalışmayı kesinlikle uygun olduktan sonra kesinlikle göndereceğim.

Açıklığa kavuşturmak için: birincil amaç iki kayıt kümesini eşleştirmek mi?

Kayıtları eşleştirmeye çalışırken, bir eşleşmenin gücünü ("Bob" ile "Bob" ile çok benzer) arasında olası eşleşme sayısını (çok sayıda Bobs vardır) ayırdığınızdan emin olun. İki kayıt aynı ada sahipse ve bu ada sahip başka kayıt yoksa, adresler farklı olsa bile muhtemelen aynı kişidir. Tabii ki büyük bir korpusunuz olduğunu varsayalım.
Tüm İşlemlerden Jon,

Yanıtlar:


20

Orada bu büyük deneme (İspanyolca, üzgünüm) Pablo Pazos, 2006 yılından bu yana Sağlık Bilişim üzerinde çalıştığı ve o bu iş için bir algoritma tanımlayan alanda, bazı büyük katkılarda bulunmuştur Uruguay bir CS Mühendisi tarafından yazılan.

Makaleyi bir tercüman aracılığıyla çalıştırabilirsiniz, ancak bunun özü, bir kişinin kimliğini belirleme konusunda temel bilginin kendilerine verilen adlar ve aile adları (hem babadan hem de anneden), cinsiyet ve doğum tarihi olmasıdır. İlginç bir şekilde, SSN gibi kimlik numaralarını kimlik eşleme algoritmalarından özellikle hariç tutuyor, çünkü “herhangi bir tanımlayıcı kimliğinin bir parçası değil” (sanırım bu konu tartışılabilir olabilir). Ayrıca, sokak kimliği, telefon numaraları vb. Gibi özellikleri hariç tutuyor, çünkü birinin kimliğiyle gerçekten ilgili değil, “gerçekte kim olduğu” ile ilişkili değil.

Ayrıca, önceki özelliklerin her birine farklı "ağırlıklar" atar, şunun gibi:

  • İlk isim:% 17.5
  • Orta isim:% 17.5
  • Aile adı (baba):% 17,5
  • Aile adı (anne):% 17,5
  • Cinsiyet:% 10
  • DOB:% 20

Bu özelliklerin her birinde bulunan eşleşmelerle, kayıtlar arasında karşılaştırma yapmanın mümkün olduğu bir bileşik "uyumluluk eşleşme endeksi" elde etmek için bir metodoloji tanımlamaktadır. Ayrıca, isim özniteliklerinde "kısmi" eşleşmeler Levenshtein uzaklığı gibi algoritmalar kullanılarak da mümkündür .

İyi okumalar IMO. Üzgünüm ispanyolca, ama umarım ana fikirlerini iletebildim.


2
bu harika, teşekkürler. Tipo olarak mesafeden bahsetmek için de + 1, özellikle Kuzey Amerika'da olduğu gibi, kültürel arka planı çok çeşitli olan topluluklarda oldukça yaygındır. Bu, yapmak zorunda olduğum örneklerin çoğunun olası değerlerin alanıyla eşleştiğini söyledi. Bu nedenle, bu durumlarda, veritabanında tek bir isabet getiren güvenilir bir kriter (sağlık sigortası numaraları gibi) yeterli olacaktır, eğer birden fazla giriş iade edilirse, kullanıcıya (varsa) sorma ya da ek kritere göre filtreleme yapma eğilimindeyim.

(... devam) Bu vakaların, bir EMR'nin bir klinik veya hastaneye veya bir RİS'in bir radyo9oloji bölümüne yerel olarak kurulmasına iyi uygulandığını unutmayın. Bu durumlarda müşteri ya kliniğe ya da hastaneye kayıtlıdır ya da değildir. MPI durumunda ise bu tamamen yeni bir top oyunudur.

13

Hasta eşleştirmesi için tek bir sihir algoritması yoktur ve olacağından şüpheliyim.

Yeni başlayanlar için bölgesel farklılıklar var. MMattoli'nin belirttiği gibi, Amerika Birleşik Devletleri'nde bir hastanede iyi sonuç veren, Aborjinleri tedavi eden kırsal bir Avustralya kliniğine muhtemelen uymayacak.

Ayrıca, ayrı ayrı siteler hata toleransı konusunda farklı görüşlere sahiptir. Sadece tam olarak emin olduğunuzda eşleşirseniz , çok fazla kaçırılan eşleşme elde edersiniz. Bu, başka bir dizi problem yaratan yinelenen hasta kayıtlarına neden olur. Çoğu site için razı etmeye istekli olacaktır oldukça emin , ama ne kadar tabi tabi yeterli mi? 10 kişiye sorun, 12 cevap alırsınız.

Bu nedenle, "en iyi" algoritma yapılandırılabilir, böylece müşterileriniz gereksinimlerine uyacak şekilde ayarlayabilir.

Bir eşleşme düşünülürken, farklı alanlar farklı derecelerde güven sunar.

Sağlık hizmetine özgü tanımlayıcılar en fazla güven sunar, çünkü bütün amaçları sağlık sistemindeki kişiyi benzersiz şekilde tanımlamaktır. Hastaneler genellikle çoğaltılmadıklarından emin olmak için acı çekiyorlar.

Örnekler:

  • Ulusal Sağlık Kimliği (örneğin, UK NHS Numarası)
  • Hastane Atanmış Tıbbi Kayıt Numarası.

Diğer hasta tanımlayıcıları olabilir sistemine bağlı olarak, hem de yüksek güvenini sunuyoruz. Örneğin, bir Askeri Kimlik muhtemelen bir askeri hastanede çok ilgilidir.

Örnekler:

  • Askeri kimlik
  • Sigorta kimliği
  • Sosyal Güvenlik Numarası (ABD'de, Sosyal Güvenlik Numarası, yaygın sigorta sahtekarlığı nedeniyle genellikle güven derecesi yüksek bir eşleşme olarak kabul edilmez .)

Benzersiz tanımlayıcıların olmaması durumunda, kişi demografik bilgilere başvurmalıdır. Herhangi bir alanda eşleşmemesi tavsiye edilir , ancak demografik alan eşleştikçe eşleşme o kadar emin olur.

Sık sık değişmeyen bir insan hakkında şeyler eşleştirme için iyidir:

  • ad
  • Cinsiyet
  • Doğum tarihi

Ancak güven arttırmak için maçta daha da fazla dövülebilir bilgi düşünülebilir:

  • Adres
  • Telefon numarası
  • E

3
SSN'nin de çok katı bir kısıtlaması var; örneğin Kanada'da, bir işveren ya da banka olmadıkça sizden istemeniz bile yasa dışıdır (belki biraz daha fazla, ben avukat değilim). Çin gibi diğer yerler de yoğun trafik tatillerinde tren bileti almak için bile neredeyse her şey için kullanıyorlar.

Kadın iseniz isim değişikliği sık görülür. Ve iki kişi genellikle aynı ada sahip ve hatta aynı yerde yaşıyor (örneğin ondan sonra bir oğlu olan baba).
HLGEM

@HLGEM: Tamamen doğru, bu nedenle eşleştirme için tek bir demografik alan kullanılmamalıdır. Ancak insanlar buna başvurmak zorunda kaldıklarında, statik olan alanlar (yine de bazen değişiyorlar) alternatiflerden daha güvenilirdir. Bu onları iyi yapmaz.
Lynn,

7

Bunlar, sıklıkla değiştikçe önceki soyadlarını da kontrol etmeye değer.


+1 "sık sık" bir understatement. :) Bu kesinlikle tanımlanamayan ya da adlandırılmamış, yeni doğmuş, yanlış tanımlanmış vb. Hastalar için geçerli olabilir. Çok fazla işlem yapılan bir ortamda isimler daha zor, ancak daha da önemlisidir.

4

Aşağıdaki üçünün bariz kombinasyonları dışında sorunuzda verilen

First Name
Last Name
Date of Birth
City
State
ZIP/Pin Code

phone number (Home and/or Cell)Listeye eklemeyi düşünürdüm . Bu günlerde oldukça yaygındır ve herkesin kendine özgü bir numarası olacaktır ve bazı kişiler telefon numaralarını değiştirse bile, eski telefon numaraları çoğu kişi tarafından hatırlanır, bu yüzden kullanışlı olabilir.

Adresin çoğu zaman birden fazla yazımdan ve özellikle insanların yerel bir dil kullandığı Hindistan gibi ülkelerde ve birden çok işleme yolundan muzdarip olduğunu ve hasta yönetimi yazılımlarının 'hala' İngilizce'yi kullandığını gördük.


3

Kayıtlardaki cinsiyet genellikle İlk Addan türetilmiştir. Cinsiyet adından cinsiyeti çıkaramadığımız zaman, yabancılarda cinsiyette artış olduğunu gördüm.

Almanya'da, bazen 'ae oe ue' ile değiştirilen 'äöü' benzeri 'Umlaute' içeren isimlerle birlikte bazı farklılıklar var.


1

Benim düşüncem aşağıda sıralandığı gibidir). SSN, Soyadı ve ilk adın ilk 5 karakteri 2). SSN, Doğum tarihi ve ilk adın ilk 5 karakteri 3). SSN, Doğum tarihi ve soyadı 4). SSN, Cinsiyet, Doğum Tarihi 5). Soyadı, adın ilk 5 karakteri, şehir ve posta kodu.


1

Bu ABD'de gerçekten zor bir problem. İsimler benzersiz değildir ve bir insanın yaşamı boyunca sıklıkla değişir veya farklı bir şekilde sunulur (örneğin Rob ve Robert gibi), bu nedenle hastayı tanımlamak için asla daha güvenilir bilgiler ile birlikte kullanılamazlar. Sağlık sigortası numarası ve sağlayıcısı çok daha sık değişiyor ve ailenin birden fazla üyesi için aynı olabilir. SSN'nin sözde benzersiz olduğu, ancak çevresinde sahtekarlık var. Elbette herkesin sahip olamayacağı Driver liscense numarası ile aynı.

Şahsen, sigorta poliçesi numarası ve doğum tarihi ve isim birleşimi, ardından ssn ve doğum tarihi ve isim birleşimi ile başlardım. Adres ve telefonu kontrol eder, eşleştiğinde bana fazladan güvence verir, ama eşleşmediğinde fazla kilo almazdım. Ayrıca, kan türünü biliniyorsa (ve hepimiz hastane vampirlerinin kan numuneleri alacağını biliyoruz) bu değişmediği için bir ekarte faktörü olarak kullanırdım. İsim eşleştirmesi problemi nedeniyle isim eşleşmesinin bulanık eşleşme olması gerekir. Diğer şeyler genel olarak tam bir eşleşme bulmalı, eğer güven derecesi gerçekten yüksekse (SSN'ye giren bir yazım hatası olabilirdi) ilk önce bulanık bir eşleşme bulmalı.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.