Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentes Révision précédente | |||
|
anciens_numeros:numerisation [2026/02/27 20:17] 47.128.40.21 ancienne révision (2026/02/22 14:35) restaurée |
anciens_numeros:numerisation [2026/02/28 01:50] (Version actuelle) 47.128.126.140 ancienne révision (2026/02/23 15:16) restaurée |
||
|---|---|---|---|
| Ligne 17: | Ligne 17: | ||
| *423 * 40 * 5 / 60 / 60 = 24h pour la numérisation. | *423 * 40 * 5 / 60 / 60 = 24h pour la numérisation. | ||
| - | ===== Etapes | + | ===== Technique |
| - Massicoter | - Massicoter | ||
| - | - Scan si possible tiff 300dpi nommés | + | - Scan si possible tiff 300dpi nommés |
| - | - Recadrage en batch (selon les format des ldln) avec xnview ou autres et conversion en jpeg nommés | + | - Recadrage en batch (selon les format des ldln) avec xnview ou autres et conversion en jpeg nommés |
| - 2 branches de Conversion | - 2 branches de Conversion | ||
| - | - en pdf classique (avec texte OCRisé) par Acrobat DC, un pdf par ldln. ldln0nnn.pdf | + | - en pdf classique (avec recherche |
| - | - en texte brut ldln0nnn.txt et images jpg numérotées | + | - en texte brut ldlnxxxx.txt et images jpg numérotées |
| - | - réalisation d'un index complet automatiquement regroupant tout en un seul pdf chapeau. | + | - réalisation d'un index complet automatiquement |
| - | - extraction automatique de toutes les sous images nommées ldln0nnn_ppp_zz.jpg | + | - concaténation (automatique) de tout les .txt en un seul fichier de ~100Mo (peut tout à fait être ouvert dans certains éditeurs de texte, pour possibilité d'un recherche full text très basique) |
| - | - concaténation (automatique) de tout les .txt en un seul fichier de ~100Mo (peut tout à fait être ouvert dans certains éditeurs de texte, pour possibilité d'un recherche full text très basique, mais suffisante dans beaucoup de cas) | + | |
| - | ===== outils logiciel ===== | + | La méthode pour faire des multi pdf indexés : https:// |
| - | + | ||
| - | La méthode pour faire des multi pdf indexés | + | |
| - | + | ||
| - | choix 1 : adobe acrobat pro dc : https:// | + | |
| - | * génère les index, et index multi pdf. | + | |
| - | * peut aussi extraire automatiquement les images | + | |
| - | choix 2 : https:// | + | |
| - | * a l' | + | |
| - | * on génère un fichier d' | + | |
| - | * on fusionne (merge) tous les index en un seul | + | |
| - | * ne semble pas capable de faire pointer in pdf d' | + | |
| - | + | ||
| - | Pour créer et utiliser un index (acrobat) | + | |
| - | + | ||
| - | https:// | + | |
| - | + | ||
| - | A connaître dans acrobat reader : crtl + shift + f permet de lancer une recherche dans tous les pdf dans un répertoire. J'ai essayé, mais je doute que ce soit utilisable pour 400+ pdf, c'est très lent, et même après la recherche, l' | + | |
| - | + | ||
| - | https:// | + | |
| - | + | ||
| - | Il est aussi possible de laisser complètement la tache à windows. Il peut en effet indexer tous les pdf. Ca donne des recherches très rapides. Il faut ensuite ouvrir le fichier sélectionné et refaire une seconde fois la même recherche. Pour que ça marche sous win 7/8/10, il faut faire une manip dans windows. | + | |
| - | + | ||
| - | http:// | + | |
| + | pourrait peut-être aussi utiliser https:// | ||
| ===== Pérennité des fichiers générés ===== | ===== Pérennité des fichiers générés ===== | ||