Çevrimiçi coğrafi kodlamayı bir gizlilik ihlali olarak kabul eder misiniz?


21

Belirli bir çalışmaya katılan bireylerin bir sürü adresinin olduğunu varsayalım (büyük olasılıkla - sağlıkla ilgili, mahremiyet ve etik kaygıların her zaman önemli konular olduğu yerler).

Günümüzde, Google veya Yahoo gibi sağlayıcılar konumsal doğruluk açısından iyi sonuçlar sunmaktadır .

Kuzey Amerika Merkezi Kanser Kayıtları Birliği ( NAACCR ), ' Coğrafi Kodlama En İyi Uygulamaları: Sekiz Yaygın Kullanılan Kullanılan Coğrafi Kodlama Sisteminin Gözden Geçirilmesi ' ve ' Bir Coğrafi Kodlama En İyi Uygulamalar Kılavuzu ' kılavuzlarında bu seçenekleri listeler .

Örneğin Tarçın ve Schuurman (2010), düşük kaynak ortamındaki yaralanmaları araştırmak için araçlarının bir parçası olarak BatchGeocode hizmetini kullandı.

Bu tür adresleri Google Haritalar veya OpenStreetMap gibi çevrimiçi hizmetleri kullanarak coğrafi kodlamayı düşünür müsünüz?

PS1 muhtemelen ilgili bir soru .

PS2'nin Epidemiyoloji alanındaki son makalesi (alanın önde gelen hakem dergilerinden biri), Google Haritalar ve Yerler API'lerini kullanarak coğrafi kodlamanın nasıl yapıldığına dair ayrıntılı talimatlar içeren kısa bir iletişim yayınladı. İlginç bir şekilde, güvenlik / gizlilik hakkında bir söz değil ...


Topluluk wiki kapsamı sorusu?
artwork21

Yanıtlar:


11

Burada kesinlikle bir gizlilik uygulaması var - özellikle de küçük veri kümeleriyle çalışıyorsanız. Veri akışını incelemeyi deneyen herkes, aynı gruptaki tüm taleplerin ortak bir şeylerinin olduğunu - tıbbi durum veya kişisel bilgiler tel üzerinden açıklanmadığında bile - kabul edebilir.

Daha iyi bir teknik, toplu coğrafi kodlama için pek çok ilgisiz veri / hastayı toplu halde toplamaktır.

Örneğin - coğrafi kodlamaya ihtiyaç duyan verilerinizi diğer araştırmacılarla birleştirmek - ne kadar alakasız sorunlar o kadar iyi. İsteklerin sırasını randomize edin. Ve günde bir kez toplu işlem, bu sırada gerçekleşir, hepsi bir kerede.

Şimdi bir saldırgan coğrafi kodlama isteklerini duyabiliyor olsa bile, verileri toplamak oldukça zorlaşıyor.


İlginç! Bu süreci kolaylaştıracak herhangi bir araç / platform var mı?
Nicolas Raoul

8

Güvenli bir sunucuda şifrelenmiş dosyalarla yerel olarak coğrafi kodlama kesinlikle gizlilik için altın standart olacaktır. Uzak bir API kullanarak coğrafi kodlama gerekiyorsa, Tor kullanmak bir sonraki en iyi şey olacaktır.

Tor, iletişiminizi dünyanın her yerindeki gönüllüler tarafından yürütülen dağıtılmış bir röle ağı etrafında zıplatarak korur: ziyaret ettiğiniz sitelerin fiziksel konumunuzu öğrenmesini önler.

Rastgele adreslerin enjeksiyonu ile (buradaki diğerlerinin önerdiği gibi) ve iletişimi bitiş noktalarına şifrelemek için ssl (https) kullanmanın yanı sıra (bunu da yaptığınızdan emin olun), uzaktan coğrafi konumdan daha güvenli bir yol düşünemiyorum. Tor Projesi . Hangi coğrafi kodlama hizmetini kullanırsanız kullanın, isteklerin nihayetinde nereden geldiğini ve https ile de kimsenin istemediğini tespit edemezsiniz. Not: Bunun için bir api anahtarı gerektiren bir coğrafi kodlama servisi kullanmayın, yoksa artık isimsiz kalmazsınız. (Google artık bir api anahtarı gerektirmiyor).

Tor kullanma hakkında daha fazla ayrıntı burada ilgili bir soruya cevabım.


Teşekkürler, Tor hakkında düşünmedim ama iyi bir fikir gibi görünüyor.
radek

Tor kullanıyor olsanız bile, coğrafi kodlama sunucusu bilgilerinizi almaya devam eder, bu gizliliğin temel bir ihlalidir. Coğrafi kodlama sunucusuna güvenemezsiniz.
Nicolas Raoul

8

SmartyStreets adında bir adres doğrulama şirketi için çalıştığımdan bu yana son zamanlarda defalarca bana sorulan mükemmel bir soru.

Öncelikle, bir posta adresi haritadaki tek bir konumlandırılabilir noktayı temsil eder. Bir adres kendiliğinden doğası gereği iyi huyludur, çünkü herhangi bir ek bilgiye sahip değildir. Haritada bir nokta çizmek hiçbir şey yapmaz. Sadece CONTEXT'i o noktaya (adres) atamaya başladığınızda, bir şeyler ifade etmeye başladığını gösterir.

Bunu akılda tutarak, posta adresi bir kişiyi, bir organizasyonu, bir binayı, bir arabayı, her neyse temsil edebilir. Birden fazla posta adresi toplamaya başladığınızda, bu gruplandırmadan türetilen içeriği artırırsınız. Adreslerin ortak noktası olup olmadığını görmek için benzerlikler belirlenebilir. Yine de, sadece benzer bir alandaki adres gruplaması fazla bağlam ifade etmez. Bir google haritaya bakabilir ve belirli bir bölgedeki tüm evleri görebilirim. Ayrıcalıklı bilgilere yetkisiz erişimim olmadığı sürece bu bir gizlilik ihlali değildir.

Her türlü özel bilgiyi fiilen vermemek için diğer bağlam noktaları birleştirilmelidir. Örneğin, adres doğrulama ve / veya coğrafi kodlama için çevrimiçi bir hizmete gönderilen bir posta adresi grubu, listeyi işlemek için kimin gönderdiğini bilmediğiniz sürece bilgi vermez. Liste sahibi bilindikten sonra, listenin kullanım amacı hakkında belirli çıkarımlar yapılabilir. Liste sahibi ve kullanım amacı gibi bu ek bağlamı bilmek kesinlikle ayrıcalıklı bilgiler olarak nitelenir ve gizlilik ihlali kaynağı olabilir.

İşleme "şirket içi" getirilmesi, böylece hiçbir dış veri servisine dahil edilmemesi bir seçenek değildir. Ayrıcalıklı bilgilere her türlü yetkisiz erişimi kesinlikle dışlar. Adres doğrulama ve coğrafi kodlama, başlatılmamışlar için bir görev değildir ve kesinlikle çok fazla zaman ve kaynak tüketmeden çok büyük listeleri işlemek için ileri beceriler (zaman içinde edinilen deneyim anlamına gelir) gerektirir. Öyleyse onu eve getirmek kesinlikle bir seçenektir, ancak hassas adres bilgisine sahip her şirket, kendi “güvenli” adres işlemlerini (coğrafi kodlama dahil) evde yapmak için gerekli kaynaklara sahip mi? Hayır. (Bu web sitesinin okuyucuları için kesinlikle iş güvenliği anlamına gelse de.)

Gerekli gizliliği korumanın ve hala çevrimiçi hizmetleri kullanmanın yolları vardır. Bir yöntem, bir hesap oluşturmak, her şeyi test etmek ve çözümlemek ve ardından geçici bir e-posta adresi kullanarak, size geri izlenemeyen bir kredi kartıyla ilişkili, ilgisiz bir fatura adresiyle yeni bir hesap oluşturmaktır. Bu hesaptaki adreslerin işlenmesi teorik olarak değerli herhangi bir bağlam vermeyecek ve böylece listedeki kişilerin gizliliğini koruyacaktır. (Bu, Enemy Of The State filmi gibi konuşmaya başladı .

Bu karmaşık ve gereksiz geliyorsa, katılıyorum. Daha basit bir yöntem, HTTPS ve POST kullanan ve işlediğiniz verilerin hiçbirini saklamayan veya günlüğe kaydetmeyen bir API'den yararlanmaktır. HTTPS kullanımı, tek kaydın zaman damgası ve aradığınız IP adresi olacağı anlamına gelir. Temel URL bilinmiyor. Elbette, kullandığınız hesap size geri dönecektir, ancak bu bir sorun değildir, çünkü bir POST isteği kullanmak bir yük yükü eklemenize izin verir (bu durumda bir adres grubu) ve yükün içeriği kaydedilmez. Dolayısıyla, gönderdiğiniz adresler hiçbir sunucu günlüğünde değildir. Ve her işlem arasında hafızanın silinmiş olması, bu adreslerin hiç kaydedilmediği veya kaydedilmediği ve size geri iletilmelerinin güvenli bir bağlantı üzerinden yapıldığı anlamına gelir.

13Mar2012 06:31 (-6) IP: 12.134.223.12 Kullanıcı Adı: 875564 - POST MİKİ: 3439942 - [İşlendi]

Kayıtlara bakan herkes yalnızca bazı adresleri işlediğinizi görecek ve hangi adreslerin işlendiğine dair hiçbir fikirleri olmayacaktı. Bu, en katı gizlilik politikası gerekliliklerini bile karşılar. Bu tür bir hizmetin nerede bulacağına değinmeden (ve çok hızlı ) mümkün olduğunu belirtmek benim için anlamlı olmaz . SmartyStreets'in LiveAddress API hizmetine zaten yerleştirildi. Cdyne, QAS ve ServiceObjects gibi diğer hizmetler de benzer hizmetler sunabilir, ancak henüz bir şey duymadım.


Detaylı bilgi için teşekkürler. HTTPS kesinlikle makul bir fikir gibi geliyor. SmartyStreets'in ABD ile sınırlı olduğunu sanıyorum?
Radek

Evet, SmartyStreets adres doğrulama ve coğrafi kodlama ABD Posta Servisi adresleriyle sınırlıdır.
Jeffrey

5

Muhtemelen bir kimlik oluşturabilir, masanızı bölebilirsiniz. Kişisel olarak tanımlanabilir bilgilerin kaldırılması. daha sonra geocoding işleminden sonra masaya tekrar katılın.

(Birleşik PCness) damarında, verileri bir sunucuda bir yerde çalıştırdığınızda, gözaltına alma zincirinde kalmadığınızı kanıtladığınızı farz ediyorum.

İzlemek istersen konuyla ilgili bir miktar yazı buldum ...

Bulut bulundurma ve kontrol

Elektronik yaş bulundurma ve kontrol

Google kitabı

Cloud computing'in yasal uygulaması

Yürütme, yasaya göre yapılırsa, bulut bilişim devlet hizmetlerinden tamamen çıkarılabilir.


5

Hayır, çevrimdışı olarak coğrafi kod yazabilirsiniz. Çevrimiçi toplu coğrafi kodlayıcılar kullanıyorsanız, adresleri coğrafi koordinatlara dönüştürmek nasıl bir gizlilik sorunu olur? Herkesin adı dahil edildiyse ve duyurulsaydı daha önemli olurdu. Brad, bir ID ile ayrı bir adres verdiğinden ve adresler coğrafi kodlandığında yeniden gönderdiğinden bahseder. Standart pratik.


5
Çevrimdışı olarak coğrafi kod yapabileceğinizi ve herhangi bir kişisel bilgiyi ifşa etmeniz gerekmediğini kabul ediyorum. Ancak, yalnızca adı ve kimliği özel tutulması gereken bilgiler olarak kabul eden önerinizle aynı fikirde değilim. Bir kişinin ev adresini, isminiz olmasa bile ifşa ederseniz, onları esasen tanımladınız. Aşırı derecede bulaşıcı bulaşıcı hastalığı olan insanların evleriyle ilgili bir harita yayınlamayı düşünün.
DavidF

2
Mapperz'in dediği gibi, gönderdiğiniz bilgiler adresle sınırlı olduğu sürece bir sorun olmamalıdır. Gönderdiğiniz bilgilere "HECD" yi veya başka bir hassas bilgiyi dahil etmeyin.
jvangeld

1
@DavidF her adresin coğrafi koordinatları vardır - coğrafi kodlama% 99.9 otomatiktir [hesaplama], gizlilik kaybedilmez. Çevrimiçi beğenmiyorsanız, buraya koymayın, çevrimdışı bir sürüm kullanın.
Mapperz

2
@ jvangeld Üçüncü şahısların coğrafi kod isteği ve adreslerini gönderen kuruluşun kimliğini birleştirmesi durumunda çevrimiçi ortamda mahremiyetin ihlal edilebileceğini düşünüyorum. Halkın Vampirizmin Tedavisi Cephesi, içinde 100 adres bulunan bir toplu coğrafi kod verirse, üçüncü bir tarafın, 100 evin “alternatif yaşam tarzını” iyileştirmeye çalışan insanlar olduğunu makul bir şekilde kabul edebileceğini düşünmüyor musunuz? Açıkçası, bu oldukça akademik bir argümandır, ancak gizliliği ve gizliliği gerçekten korumak istiyorsanız, bunun konuyla ilgili olduğunu düşünüyorum.
DavidF

1
@DidFF düşüncesi buradaki konuya çok önem verir: ev adresi çok hassas olarak kabul edilir ve potansiyel olarak çalışma katılımcılarının açıklanmasına yol açabilir. Vampirizmi inceleyen bir kurumun IP adresinden 1000 talep varsa, potansiyel vampirlerin adreslerine sahip oldukları varsayılabilir. Buradaki sorunum, çevrimiçi coğrafi kodlama hizmeti bu koşullar altında 'güvenli taraf' olarak kabul edilebilir mi? Verilerinizi çalışmanın parçası olmayan yetkisiz kişilerle paylaşmakla suçlanabilir misiniz? Parti, coğrafi kodlama sürecinde potansiyel verilere erişime sahip olduğunu mu?
radek

4

Coğrafi kodlama düşük riskli Bu yılın başlarında bazı hastanelerle çalıştık ve bu soru gündeme geldi. Coğrafi kodlama hizmetinin kendisi büyük bir endişe kaynağı değildi, çünkü verilerden kimliği ve adres hariç tüm bilgileri çıkardık, güvenli transfer (https) kullandık ve kurum içi geocoder'ımız TOS kriterlerini karşılayacak gizlilik korumaları belirledi.

Konumları Anonim Olarak Görüntülemek Daha Zordur Zekice bir bit, gizliliği korurken diğer yandan çok seyrek veri haritaları görüntülüyordu. Müşterinin istediği ilk seçenek, her bir noktaya rastgele bir "geçiştirme" eklemek ve böylece gerçek ev yerinin gizlenmesini sağlamaktı. Bu yaklaşımla ilgili sorun, gerekli şekerleme büyüklüğünün oldukça büyük (1/2 mil veya daha fazla) (bir çiftlikte yaşıyorsa) ve harita kullanıcılarının nokta konumlarını doğru alma eğiliminde olmalarıdır. Yine de yararlı bir haritaya sahipken anonim olarak yeterince görünen noktaları bir araya getirmeye karar verdik. Çalıştığımız diğer endüstrilerden bir norm, toplama biriminin en az 7 ila 10 kayıt içermesi gerektiği görünüyor.


2

Sanırım bunu coğrafi olarak kodluyorsunuz ve sonuçları halka açıklamıyorsunuz? Öyleyse, bulut bu verinin neyi temsil ettiğini nasıl anlar?

Muhtemelen, var olabilecek herhangi bir kalıbı gizleyerek rastgele verilerle coğrafi olarak kodladığınız tüm verileri gizleyebilirsiniz.


Doğru, önemli olan, belirli bir veri kümesi için bir dizi coğrafi koordinat elde etmektir. Analizin geri kalanının tümü çevrimdışı olacak ve daha fazla yayınlanmış olan hiçbir şey hiçbir zaman bireysel düzey bilgilerinden yararlanmayacak. veri kümesi gizleme fikrini seviyorum!
radek

2

Sorunun sorulmasından beri bu durumun yeni olup olmadığını bilmiyorum, ancak Google Haritalar Api v3'te merak eden biri varsa SSL (https) kullanabilirsiniz. Ayrıca NAACCR En İyi Uygulamalar Kılavuzunun gizlilik bölümü bu konuları tartışmaktadır.


2

Avusturya'da bu kesinlikle bir gizlilik sorunu olacaktır.

Her şeyden önce: Sağlık verileri hassas olarak sınıflandırılmıştır ve bu veri setiyle ilgili olan kişiyi açıkça onaylamadan üçüncü şahıslara elden verilmesine izin verilmediğinden şüphe yoktur.

Anonimleştirilse bile: Bu sağlık verilerini coğrafi olarak kodlamak mümkündür, ancak halka açık olan Ad-Adres Kayıtlarını (Telefon Rehberi) coğrafi olarak kodlamak ve sağlık verilerini orada yaşayan kişilere bağlamak da mümkündür, böylece adresler kişisel olarak da sınıflandırılır veri.

Bu, katılımcılara açıkça sormadan bu veri setini üçüncü bir tarafa göndererek coğrafi kodlamanıza izin verilmeyeceği sonucunu doğurur.


1

Tam bir coğrafi kod veya genel bir alana mı ihtiyacınız var? Yalnızca posta kodunu veya kısmi posta kodunu f kullanabilirsiniz.


@ user1466: kesin coğrafi kod kesinlikle burada bir tercih olacaktır.
radek

1

Bir coğrafi kodlama şirketi için çalışıyorum ( YAddress.net ) ve sıkı gizlilik gereksinimlerine sahip çok sayıda müşterimiz var - finans endüstrisi, sağlık, hukuk vb.

Gizlilik kaygılarını iki şekilde ele alıyoruz:

  1. SSL şifreli bağlantılar üzerinden çevrimiçi veri işleme (aktarım sırasında verilerin gizlenmesini önler), ayrıca tarafımızdaki gizlilik sözleşmeleri. Bu bazı müşteriler için yeterli, ancak herkes için değil.

  2. En üst düzeyde gizlilik için, coğrafi kodlamanın tamamen müşterinin tesislerinde gerçekleştiği ve hiçbir internet üzerinden veri aktarılmadığı yerinde bir yazılım dağıtım seçeneği.

Diğer yorumcuların doğru bir şekilde belirttiği gibi, kendi içinde bir posta adresi halka açık bir bilgi parçasıdır ve herhangi bir bağlamsal veri olmadan (müşteri adları, sayılar vb.) Hiçbir şeyi açıklamaz. Bununla birlikte, gerçek hayattaki işletmeler, bu mantık yürütme çizgisinin mahkemede geçerli olabileceği veya olmayabileceği gerçek hayattaki yasal ortamlarda faaliyet göstermektedir. Mahremiyet önemli bir endişe ise, yerinde bir çözümün ilave maliyeti, yoldaki potansiyel yasal komplikasyon riskini önlemek için buna değer olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.