Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
|
mass:numerisation [2026/04/14 13:40] 57.141.0.11 ancienne révision (2026/04/14 04:02) restaurée |
mass:numerisation [2026/04/14 21:28] (Version actuelle) 47.128.97.133 ancienne révision (2026/04/07 19:09) restaurée |
||
|---|---|---|---|
| Ligne 1: | Ligne 1: | ||
| ====== Techniques et outils pour une numérisation et indexation complète ====== | ====== Techniques et outils pour une numérisation et indexation complète ====== | ||
| - | Avec Adobe Acrobat DC Pro | + | Avec Adobe Acrobat DC Pro ou Omnipage |
| * La conversion des pdf bruts en pdf OCR est totalement automatique (batch sur tous les pdf d'un répertoire, | * La conversion des pdf bruts en pdf OCR est totalement automatique (batch sur tous les pdf d'un répertoire, | ||
| * La génération de l' | * La génération de l' | ||
| + | |||
| + | Si les fichiers sont stockés sur un serveur NAS Synology, le serveur peut offrir un service d' | ||
| Cependant la conversion des images vers les pdf n'est pas automatique sur une arborescence | Cependant la conversion des images vers les pdf n'est pas automatique sur une arborescence | ||
| Ligne 35: | Ligne 37: | ||
| ==== Etape 6.a : Pour la conversion pdf en pdf avec recherche de texte possible (OCR) ==== | ==== Etape 6.a : Pour la conversion pdf en pdf avec recherche de texte possible (OCR) ==== | ||
| + | === Acrobat DC Pro === | ||
| + | |||
| Acrobat DC Pro, le problème, c'est que c'est payant, avec une facture à 200€ d' | Acrobat DC Pro, le problème, c'est que c'est payant, avec une facture à 200€ d' | ||
| Ligne 42: | Ligne 46: | ||
| Bizarrement, | Bizarrement, | ||
| + | === Nuance Omnipage === | ||
| + | Semble aussi faire l' | ||
| + | |||
| + | 199€ en ultimate, 99€ en version standard (2018) | ||
| + | |||
| + | Les deux versions exploitent tous les processeurs et reconnaissent automatiquement la langue. Ainsi Omnipage résout les deux problèmes de Acrobat DC Pro, sensiblement au même prix et sans abonenment. | ||
| + | |||
| + | Version d' | ||
| + | |||
| + | Tableau comparatif des version standard vs ultimate : https:// | ||
| + | |||
| + | === Google Vision Api === | ||
| + | |||
| + | Pour les petits pdfs, résultats de scans de mauvaise qualité, trop illisibles pour Nuance Omnipage, google propose une api (interface programmatique web) pour l' | ||
| ==== Etape 7 : l' | ==== Etape 7 : l' | ||
| + | |||
| + | === Acrobat DC Pro === | ||
| La méthode pour faire des multi pdf indexés : le même logiciel | La méthode pour faire des multi pdf indexés : le même logiciel | ||
| Ligne 62: | Ligne 82: | ||
| {{youtube> | {{youtube> | ||
| + | === Windows === | ||
| Il est aussi possible de laisser complètement la tache à windows. Il peut en effet indexer tous les pdf. Ca donne des recherches très rapides. Il faut ensuite ouvrir le fichier sélectionné et refaire une seconde fois la même recherche. Pour que ça marche sous win 7/8/10, il faut faire une manip dans windows. | Il est aussi possible de laisser complètement la tache à windows. Il peut en effet indexer tous les pdf. Ca donne des recherches très rapides. Il faut ensuite ouvrir le fichier sélectionné et refaire une seconde fois la même recherche. Pour que ça marche sous win 7/8/10, il faut faire une manip dans windows. | ||
| Ligne 67: | Ligne 88: | ||
| http:// | http:// | ||
| + | === Omnipage === | ||
| + | On peut aussi indexer des pdf en masse. Mais pas clair si le fichier d' | ||
| ===== Etape 8.a : Conversion en .txt en batch ===== | ===== Etape 8.a : Conversion en .txt en batch ===== | ||