Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentes Révision précédente | |||
|
mass:numerisation [2026/01/09 19:37] 47.128.55.51 ancienne révision (2025/04/26 10:00) restaurée |
mass:numerisation [2026/01/09 20:05] (Version actuelle) 47.128.56.174 ancienne révision (2025/01/26 01:52) restaurée |
||
|---|---|---|---|
| Ligne 1: | Ligne 1: | ||
| ====== Techniques et outils pour une numérisation et indexation complète ====== | ====== Techniques et outils pour une numérisation et indexation complète ====== | ||
| - | Avec Adobe Acrobat DC Pro | + | Avec Adobe Acrobat DC Pro ou Omnipage |
| * La conversion des pdf bruts en pdf OCR est totalement automatique (batch sur tous les pdf d'un répertoire, | * La conversion des pdf bruts en pdf OCR est totalement automatique (batch sur tous les pdf d'un répertoire, | ||
| * La génération de l' | * La génération de l' | ||
| + | |||
| + | Si les fichiers sont stockés sur un serveur NAS Synology, le serveur peut offrir un service d' | ||
| Cependant la conversion des images vers les pdf n'est pas automatique sur une arborescence | Cependant la conversion des images vers les pdf n'est pas automatique sur une arborescence | ||
| Ligne 17: | Ligne 19: | ||
| - Ocr-isation | - Ocr-isation | ||
| - en pdf classique (avec texte OCRisé) par Acrobat DC **(non divulgué, privé)** | - en pdf classique (avec texte OCRisé) par Acrobat DC **(non divulgué, privé)** | ||
| - | | + | |
| - Conversion en texte à partir des pdf ocrisés. | - Conversion en texte à partir des pdf ocrisés. | ||
| - en texte brut **(non divulgué, privé)** | - en texte brut **(non divulgué, privé)** | ||
| Ligne 23: | Ligne 25: | ||
| ===== outils logiciel ===== | ===== outils logiciel ===== | ||
| - | ==== Pour la conversion jpeg en pdf récursive en masse ==== | + | ==== Etape 5.a Pour la conversion jpeg en pdf récursive en masse ==== |
| En utilisant les outils spécialement développés : | En utilisant les outils spécialement développés : | ||
| Ligne 34: | Ligne 36: | ||
| - | ==== Pour la conversion pdf en pdf avec recherche de texte possible (OCR) ==== | + | ==== Etape 6.a : Pour la conversion pdf en pdf avec recherche de texte possible (OCR) ==== |
| + | === Acrobat DC Pro === | ||
| Acrobat DC Pro, le problème, c'est que c'est payant, avec une facture à 200€ d' | Acrobat DC Pro, le problème, c'est que c'est payant, avec une facture à 200€ d' | ||
| Ligne 42: | Ligne 46: | ||
| Bizarrement, | Bizarrement, | ||
| - | ==== Pour l' | + | === Omnipage |
| + | Semble aussi faire l' | ||
| + | |||
| + | 199€ en ultimate, 99€ en version standard (2018) | ||
| + | |||
| + | Les deux versions exploitent tous les processeurs et reconnaissent automatiquement la langue. Ainsi Omnipage résout les deux problèmes de Acrobat DC Pro, sensiblement au même prix et sans abonenment. | ||
| + | |||
| + | Version d' | ||
| + | |||
| + | Tableau comparatif des version standard vs ultimate : https:// | ||
| + | |||
| + | ==== Etape 7 : l' | ||
| + | |||
| + | === Acrobat DC Pro === | ||
| La méthode pour faire des multi pdf indexés : le même logiciel | La méthode pour faire des multi pdf indexés : le même logiciel | ||
| Ligne 62: | Ligne 79: | ||
| {{youtube> | {{youtube> | ||
| + | === Windows === | ||
| Il est aussi possible de laisser complètement la tache à windows. Il peut en effet indexer tous les pdf. Ca donne des recherches très rapides. Il faut ensuite ouvrir le fichier sélectionné et refaire une seconde fois la même recherche. Pour que ça marche sous win 7/8/10, il faut faire une manip dans windows. | Il est aussi possible de laisser complètement la tache à windows. Il peut en effet indexer tous les pdf. Ca donne des recherches très rapides. Il faut ensuite ouvrir le fichier sélectionné et refaire une seconde fois la même recherche. Pour que ça marche sous win 7/8/10, il faut faire une manip dans windows. | ||
| Ligne 67: | Ligne 85: | ||
| http:// | http:// | ||
| + | === Omnipage === | ||
| - | ===== Conversion en .txt en batch ===== | + | On peut aussi indexer des pdf en masse. Mais pas clair si le fichier d' |
| + | ===== Etape 8.a : Conversion en .txt en batch ===== | ||
| - | Par utilisation de [[http:// | + | Par utilisation de [[http:// |
| En utilisant l' | En utilisant l' | ||