Ceci est une ancienne révision du document !
Dimensionnements et techniques pour une numérisation et indexation complète
Chiffres
- ~423 numéros
- ~40 pages / numéro
- <5500 caractères / page
- <1700 Ko / page en jpeg
- ~7000 Ko / page en tiff
- 5.15 sec de scan / page
- 3.5 sec d'OCR / page
total pour toute la collection
- 423 * 40 = 16920 pages
- 423 * 40 * 5500 = 93 Mo de texte brut
- 423 * 40 * 1700 = 28.7 Go en jpeg pleine page
- 423 * 40 * 7000 = 119 Go en tiff pleine page
- 423 * 40 * 5.15 / 60 / 60 = 24h pour le scan.
Numérisation et indexation en masse
Version obsolete de la suite de cette page, pour ref.