Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
mass:numerisation [2025/09/21 03:35] 14.161.11.25 ancienne révision (2025/09/08 16:25) restaurée |
mass:numerisation [2025/10/09 01:56] (Version actuelle) 114.119.158.204 ancienne révision (2025/03/19 03:43) restaurée |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
====== Techniques et outils pour une numérisation et indexation complète ====== | ====== Techniques et outils pour une numérisation et indexation complète ====== | ||
- | Avec Adobe Acrobat DC Pro ou Omnipage | + | Avec Adobe Acrobat DC Pro |
* La conversion des pdf bruts en pdf OCR est totalement automatique (batch sur tous les pdf d'un répertoire, | * La conversion des pdf bruts en pdf OCR est totalement automatique (batch sur tous les pdf d'un répertoire, | ||
* La génération de l' | * La génération de l' | ||
- | |||
- | Si les fichiers sont stockés sur un serveur NAS Synology, le serveur peut offrir un service d' | ||
Cependant la conversion des images vers les pdf n'est pas automatique sur une arborescence | Cependant la conversion des images vers les pdf n'est pas automatique sur une arborescence | ||
Ligne 19: | Ligne 17: | ||
- Ocr-isation | - Ocr-isation | ||
- en pdf classique (avec texte OCRisé) par Acrobat DC **(non divulgué, privé)** | - en pdf classique (avec texte OCRisé) par Acrobat DC **(non divulgué, privé)** | ||
- | | + | |
- Conversion en texte à partir des pdf ocrisés. | - Conversion en texte à partir des pdf ocrisés. | ||
- en texte brut **(non divulgué, privé)** | - en texte brut **(non divulgué, privé)** | ||
Ligne 36: | Ligne 34: | ||
- | ==== Etape 6.a : Pour la conversion pdf en pdf avec recherche de texte possible (OCR) ==== | + | ==== Pour la conversion pdf en pdf avec recherche de texte possible (OCR) ==== |
- | === Acrobat DC Pro === | + | |
Acrobat DC Pro, le problème, c'est que c'est payant, avec une facture à 200€ d' | Acrobat DC Pro, le problème, c'est que c'est payant, avec une facture à 200€ d' | ||
Ligne 46: | Ligne 42: | ||
Bizarrement, | Bizarrement, | ||
- | === Omnipage | + | ==== Pour l' |
- | Semble aussi faire l' | + | |
- | + | ||
- | 199€ en ultimate, 99€ en version standard (2018) | + | |
- | + | ||
- | Les deux versions exploitent tous les processeurs et reconnaissent automatiquement la langue. Ainsi Omnipage résout les deux problèmes de Acrobat DC Pro, sensiblement au même prix et sans abonenment. | + | |
- | + | ||
- | Version d' | + | |
- | + | ||
- | Tableau comparatif des version standard vs ultimate : http:// | + | |
- | + | ||
- | ==== Etape 7 : l' | + | |
- | + | ||
- | === Acrobat DC Pro === | + | |
La méthode pour faire des multi pdf indexés : le même logiciel | La méthode pour faire des multi pdf indexés : le même logiciel | ||
Ligne 79: | Ligne 62: | ||
{{youtube> | {{youtube> | ||
- | === Windows === | ||
Il est aussi possible de laisser complètement la tache à windows. Il peut en effet indexer tous les pdf. Ca donne des recherches très rapides. Il faut ensuite ouvrir le fichier sélectionné et refaire une seconde fois la même recherche. Pour que ça marche sous win 7/8/10, il faut faire une manip dans windows. | Il est aussi possible de laisser complètement la tache à windows. Il peut en effet indexer tous les pdf. Ca donne des recherches très rapides. Il faut ensuite ouvrir le fichier sélectionné et refaire une seconde fois la même recherche. Pour que ça marche sous win 7/8/10, il faut faire une manip dans windows. | ||
Ligne 85: | Ligne 67: | ||
http:// | http:// | ||
- | === Omnipage === | ||
- | |||
- | Possible ? | ||
- | ===== Etape 8.a : Conversion en .txt en batch ===== | + | ===== Conversion en .txt en batch ===== |
- | Par utilisation de [[http:// | + | Par utilisation de [[http:// |
En utilisant l' | En utilisant l' |