130.000 kağıt sayfasını 10 günde etkin biçimde nasıl tarayabilirsiniz


3

Sonunda topluma fayda sağlayacak oldukça büyük bir projem var ve toplayabileceğim tüm yardımları arıyorum. Dijitalleştirilmesi gereken yaklaşık 130.000 sayfa var. Birçoğu zımba teli veya 40 yaşından büyük kağıtlarda (ve bugünün kağıdına göre oldukça ince). Bazıları garip bir şekilde boyutlandırılmıştır (tam boyutlu yasal, haritalar ve küçük posta kartı boyutları ..). Ancak, bu çalışmayı işlemek için sadece ~ 10 günümüz var (siteye vardıktan sonra). Gece boyunca çalışabiliriz.

6 kişilik bir ekibim var ve bu görevi gerçekleştirmek için nispeten küçük bir bütçemiz var. Sayfaları ~ 25 ppm'de (dakika başına sayfa sayısı) işleyebilen modern tarayıcıları (besleme tepsisi fujitsu tarama taraması gibi) düşündük, ancak sayfaların yırtılmasından veya yakalanmasından endişe duyuyoruz (ve orijinalleri tehlikeye atmamak için çalışıyoruz) . Ayrıca zımbalar sorusu vardır (ki bunlar çıkartılabilir ...). Flatbed yapabilirdik, ama bu elle yapmak için çok büyük bir iş! Bunu her zaman çok büyük parçalar için yapabiliriz.

Sizlerin bunun nasıl başarılacağına dair çok zekice fikirleri olduğunu umuyorum Zaman ayırdığınız ve yardımınız için çok teşekkür ederim


DÜZENLE Görünüşe göre bir kombinasyon yaklaşımı ( İnce kağıt tarayıcı + dikey kopya standı ) Req'd sayfaları / dakika sağlamak için en iyi şekilde çalışır. Bir çevrimdışı öneri: Bir fotokopi makinesi? İlk olarak tüm koleksiyonun fotokopisini çekersek, fotokopi makinesini bir dijital gönderir ya da fotokopiyi bir tarayıcıya kopyalarsak ne olacağını varsayıyoruz. Bana iki kat işi gibi geliyor, ama daha iyi bilmek için teknolojinin cesaretini yeterince tanıyamıyorum.


1
Kitapları çok ucuza tarayabilen şirketler var, onlar sizin için yapabilir veya bazı fikirlere sahip olabilir. Bir kitabı tarayabilirlerse, belki de eşyalarınızı tarayabilirler ya da eşyalarınızı güvenle taramanız konusunda size geri bildirim verebilirler. Fujitsu ile iletişim kurmayı deneyebilirsiniz. Kodak tarayıcıyı daha önce görmüştüm, bir kerede fazla miktarda kullanmazdınız. Bir seferde belki 5 gibi ve daha manuel olarak beslemeye devam edin. Eski ekstra ince kağıt veya tuhaf boyutlarla nasıl başa çıkacağını bilmiyorum. garip boyutları belki iyi değil.
barlop

1
Panasonic KV serisinin "ince kağıt tarama" özelliğine sahip olduğu anlaşılıyor. panasonic.net/pcc/products/scanner/kv-s1065c_1046c/... "Artık 0.04 mm kadar ince belgeleri sürekli olarak tarayabilirsiniz. Bu, ince formları veya kuponları taramanızı kolaylaştırır. Ayrıca, ince kağıtlardan endişe etmeden taramayı kullanabileceğiniz durumların sayısını artırır." & lt; - bu nedenle, ince kağıt alıyor ve garip bir şekilde boyutlandırılmış olabilir. Panasonic'i de arayabilirsin.
barlop

1
bir diğeri- scantastik.com/hardware/kodak/kodak-i2600-scanner.htm "Çok yönlülük. Küçük veya büyük, kalın veya ince, kimlik kartları, hatta kabartmalı sert kartlar - ne taradığınızdan bağımsız olarak, Kodak'tan kağıt kullanımı gelir. Çıkış tepsisi çok çeşitli belgeleri barındıracak şekilde kolayca ayarlanabilir."
barlop

1
Tarayıcıları yanınıza alıyorsanız, eski CCFL geçiş sırasında kırılabileceği için LED aydınlatmalı tarayıcıları öneririm ve bu ihtiyacınız olmayan bir baş ağrısıdır.
cybernard

1
@ cybernard 6 kişilik bir ekibe sahip, bir tarayıcının etrafında kalabalık olacaklarını sanmıyorum .. Ama aynı zamanda, bazen bir seferde bu kadarını koyamazsın, bir seferde birkaç kez elle beslemek zorundasın Aksi takdirde, hıçkırık olabilir .. Tarayıcının maksimum hızını alabilirsiniz (Sanırım çözünürlüğü veriyorsunuz, bu nedenle, yavaş bir hız önerirsiniz), ancak yine de 6 kişisi varsa, aynı anda kullanamayacaklardır. ; 6 tarayıcılar {Bu durumda, bir kerede bir demet elle beslemeniz gerekiyorsa). Beslemek için geliştirmesi kolay, hafif bir beceri, sonuncusu girdiği gibi, yenilerini koymak, .. bunu gördüm ...
barlop

Yanıtlar:


6

Bunların sadece faks makinesine ihtiyaç duyuyorsanız ve mükemmel sunumla pek ilgilenmiyorsanız, dikey kopya standı .

Sıkışmama garantisi, farklı ortamlar için kolayca ayarlama, makul derecede OCR için düz ve tüketici düz yataklı platformundan çok daha hızlı.

Ev yapımı bir tane oldukça ucuz olabilir ve daha sonra yığını kameranın altına bırakabilir, kamerayı çerçevenin maksimum doldurulacağı şekilde ayarlayabilir ve ardından her birini çekerek sayfaları çevirmeye başlayabilirsiniz.

Otomatik odaklama herhangi bir derinlik değişimini gerçekleştirmelidir ve zımbaları / ciltleyicileri / vb. Çıkarmanıza gerek kalmaz.

Kameraları çalıştıran 6 kişinin hepsine yetecek kadar ucuz olabilir.

Akılda tutulması gereken iki şey:

Rastgele gürültü ile dolu bir 8.5 x 11 sayfa @ 150ppi, rgb yaklaşık 1 MB jpg sıkıştırılmış olacak, bu yüzden en az 200GB ücretsiz depolamaya ihtiyacınız olacak.

130.000 / 6 kişi / günde 10 saat / günde 8 saat / saatte 60 dakika = dakikada 5 tarama. Bunun bir kamera için yapılabileceğini düşünüyorum, ancak tüketici sınıfı düz yataklı bir tarayıcı değil.

enter image description here


1
Muhtemelen 8 megapiksel veya daha fazla kamera olan herhangi bir kamera işe yarayacak.
Yorik

Şimdi konuşuyoruz! Bunun, google’ın kitap tarama yaklaşımına (en azından formda) gerçekten benzer olduğunu bilmiyorsanız, işte hakkında o . Henüz emin değilim, ama bu yaklaşımın (en zorlu veya en geniş formatlı parçalar için) artı yüksek verimli bir tarayıcı mı yoksa iki tanesinin mi (metin gerektireceği gibi) hız ve verimlilik arasındaki en iyi denge olup olmadığını merak ediyorum. OCR işleme).
Gryph

Şimdi her şey için kamera kullanıyorum. 4x5 ve 8x10 asetatları yakalamak için DSLR ve ışıklı masaları da arka ışık olarak kullanıyorum.
Yorik

OCR'a istediğiniz metin içeren gerçekten büyük bir öğenin muhtemelen birlikte dikilmesi gerekir. Aksi takdirde, metin boyutu makul boyutun altına düşer. Yakalama sırasında muhtemelen minimum 150 ppi istersiniz. Neyse ki, oraya gitmeden önce tüm iş akışınızı mesajlandırabilirsiniz. OCR, tarama penceresinin sonuna kadar bekleyebilir, iyi veriler yakaladığınızdan emin olun ve test ettiğiniz sürece.
Yorik

Daha düşük kaliteli sonuçlar veren ancak önemli ölçüde daha az kurulum gerektiren bir seçenek, herkesi bir tarama uygulaması olan bir akıllı telefonla donatmaktır. kullanırım Ofis lens aranabilir OCR metni içeren PDF'ler oluşturmak için Windows Phone’da ve Android ve iPhone’da CamScanner gibi iyi eşdeğerler olduğundan eminim
Micah Lindström

4

Ne tür bir tarayıcı alacağımı cevaplayamıyorum, ancak kağıdın nadiren kırılgan olduğu tüm şekil ve boyutlardaki belgeleri hazırlayan, tarayan ve arşivleyen, dijital kopyasındaki lekeleri bulmak zor olan eski bir işçi olarak deneyimlerimden söz edebilirim.

Zımbalar, köşelerin ne kadar önemli olduğuna bağlı olarak ele alınması gereken bir acıdır. Hasar görmemeleri önemliyse, ne kadar inatçı olduklarına bağlı olarak birini çıkarmak 4-15 saniye sürebilir, bazıları da patlamaktan hoşlanır, bu nedenle göz hasarını önlemek için zımbayı elinizle kapatın.
Zımbaları çıkarmak için, biri metal dişleri olan, diğeri zımba altına kaydırıp, zımba bitene kadar kaydırmaya devam eden bir tür çubuğun çıkarılması için iki farklı tipte alet vardır.
Dişli olan daha yavaş, ancak çok nadiren kağıdı yırtıyor ve kaygan olanı hızlı ancak köşeyi yırtması daha muhtemel.

Deneyimli bir ekip idare eder 130K 150-225 adam saatini bildiriyor deneyimsiz ekip, kağıt yükünün nasıl kullanılması gerektiğine bağlı olarak iki katına çıkabilir. Ancak önemli kısım, tarayıcıyı her zaman çalışır durumda tutmaktır.

Tarayıcı ve tarama hakkında vereceğim tavsiyeler, iş yükünü etkili bir şekilde tarayan kişiye iş vermenin çok önemli olduğudur. Kağıtları toplayın ve farklı belgeler arasında bazı ayırıcılar ile birlikte çalıştırın. Tarayıcı canlı yapamıyorsa postadaki belgeleri bölün.
Gerçekten ihtiyacın olacak bir "kağıt koşucu" kağıtların makinenin oryantasyonuna karışmasını önlemek için. WAAYY daha hızlı ve daha iyi sonuçlar sonra bir insan basitçe kağıtları sallıyor. Ancak yalnızca bir makine ile deneyimim var, bu yüzden (kötü olanlar varsa) kullanmadan kötülerden nasıl bir iyiyi anlatacağımı bilmiyorum.
Yüklemesi kolay bir tarayıcıya sahip olmak daha önemlidir, o zaman yüksek bir PPM hızına sahip olmaktır (her şey görecelidir). 25 ppm ile 25 ppm tarayıcı yükleyemiyorsanız, o zaman gerçekten 25 ppm aldığınız işe değmez. Makineyi yuvarlamak için gerçekten bir kerede yüzlerce kağıt yükleyebilmek istiyorsunuz.

Merak ettiğin başka şeyler varsa, onlara da cevap vermeye çalışacağım.


Bu harika bir tavsiye - kırılgan kağıdın taranması konusunda deneyiminiz var mı (20 yıl önceki makbuzları düşünün, o ince kağıt). İşe yarayabilecek bazı seçenekler görüyorum, ancak önce doğrudan sormak istediğimi düşündüm. kağıt koşucu iyi bir fikir gibi görünüyor olsa da, biraz depresyonda fiyat (2K hakkında). İçine bakacağım kiralık bunun için seçenek.
Gryph

@Gryph eski makbuzları idare etmedim ama arada bir telefon rehberi kalitesinde kağıt alıyorduk ve bu konuda özel bir şey yoktu. Küçük bir makbuz varsa, bunları standart boyutlu bir kağıda yapıştırdık ve tarayıcıdan geçirdik. Küçük kağıdın arkasında bilgi varsa, önce kağıdı kopyaladık, sonra orijinali diğer tarafla kopyanın üzerine yapıştırdık.
Gustav Eriksson

Bunu bilmek harika; Bu konuda oldukça endişeliyim. Çalışmanın sadece fotokopisini çekip kopyalarla uğraşmayı hiç düşündünüz mü? Bağırsaklarım, kalitedeki ikili işler ve düşüşün baş ağrısı olacağını söylüyor, ancak neden temyiz edildiğini görebiliyorum - çıkarılan format tutarlı olacaktı ve her kopyasını boş zamanlarında tarayabiliriz.
Gryph

@Gryph Düşünce trenini takip ettiğimden emin değilim. Makalelerin çoğu (neredeyse hepsi) saklamak için yasal olarak önemliydi (orijinalleri), çoğu zaman orijinalleri geri almak zorunda kaldık, çünkü bunun nedeni başka bir yere gönderilmeliydi (gönderenlerin zamanın% 95'i). Ucuz kişisel fotokopi makineleri ve hatta telefonlardan fotoğraflar bile gözünüzle görebildiğinizden daha fazla ayrıntı verecektir, bu yüzden kalitenin bir sorun olacağını düşünmüyorum. Bir kopyanın bir kopyasını her zaman renkli olarak görebilirsiniz, ancak Siyah veya Beyaz olan metinler her zaman keskin görünür.
Gustav Eriksson

4

Zımbaları çıkarmayla ilgili birkaç düşünce

Standart belge tarayıcıları için zımbaları çıkarmanız gerekir.

Zımbanın yanındaki kağıt kenarı tam olarak düşünebileceğiniz herhangi bir bilgiyi içermiyorsa kenarı kesmek Zımba ile birlikte. En basit ve en hızlı yol kullanmaktır. kollu kağıt kesici . Döner kağıt kesiciler daha az ergonomiktir ve bu amaç için daha yavaştır. Zımbalı belgelerinizle, bu amaç için makas kullanırsanız, özellikle daha kalın zımbalanmış belgeleriniz varsa, kısa sürede ağrıyan parmaklarınız olur.

Kenarları korumak isterseniz, epeyce farklı şekillerde seçim yapabilirsiniz. zımba sökücüler . Yüzlerce zımbayı çıkarmak için pense şeklindeki zımba sökücü Muhtemelen en iyi ergonomiyi sunar ve kağıt orijinaller için en güvenli olandır. Bunun avantajı kolu olduğu için daha az kuvvete ihtiyacınız var. Çene şeklindeki sökücüler kolu yok. Sonuç olarak, çok daha fazla kuvvete ihtiyacınız var ve yakında elinizde kramp ve kolda ağrıyan kaslar olacak; Ile aynı dil şeklinde zımba sökücüler . Kağıda çene şeklindeki kağıtlara zarar verme riski çok azdır, dil biraz daha azdır. Çene biçimli olanlarda, genellikle kağıt destesinin her iki tarafından zımba altından "ısırmanız" gerekir, özellikle de kağıt destesi daha kalın ve zımba uzunsa. Bu durumda, zımbalanmanız uzun zaman alacaktır.

İyi bir pense şeklindeki zımba sökücü kağıt yığınının üst tarafından bir "ısırık" bir defada zımbayı çıkarmak için genellikle yeterlidir. Kullandığım sökücü ile ( Skrebba skre-klick kağıdın zarar görme riski, gerekli kuvveti olduğu kadar azdır. Ama dışarıda o kadar iyi olan başkaları olabilir. Böyle bir zımba sökücü ile iki kat daha hızlı diğer ikisinde olduğu gibi nadiren kağıda zarar verir .

Yukarıda belirtilen zımba sökücü örnekleri:

"Pense-şeklinde” enter image description here

“Çene-şeklinde” enter image description here

“Dil şeklinde bir” enter image description here

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.