Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
|
anciens_numeros:numerisation [2026/05/28 04:54] 47.128.97.125 ancienne révision (2026/05/17 15:10) restaurée |
anciens_numeros:numerisation [2026/05/30 21:14] (Version actuelle) 47.128.97.157 ancienne révision (2026/05/19 22:33) restaurée |
||
|---|---|---|---|
| Ligne 24: | Ligne 24: | ||
| - Massicoter | - Massicoter | ||
| - | - Scan si possible tiff 300dpi nommés | + | - Scan si possible tiff 300dpi nommés |
| - | - Recadrage en batch (selon les format des ldln) avec xnview ou autres et conversion en jpeg nommés | + | - Recadrage en batch (selon les format des ldln) avec xnview ou autres et conversion en jpeg nommés |
| - 2 branches de Conversion | - 2 branches de Conversion | ||
| - | - en pdf classique (avec texte OCRisé) par Acrobat DC, un pdf par ldln. ldln0nnn.pdf **(non divulgué, privé)** | + | - en pdf classique (avec texte OCRisé) par Acrobat DC, un pdf par ldln. ldln_0nnn.pdf **(non divulgué, privé)** |
| - | - en texte brut ldln0nnn.txt et images jpg numérotées | + | - en texte brut ldln_0nnn.txt et images jpg numérotées |
| - réalisation d'un index complet automatiquement regroupant tout en un seul pdf chapeau. ldln_Vvvv.pdf | - réalisation d'un index complet automatiquement regroupant tout en un seul pdf chapeau. ldln_Vvvv.pdf | ||
| - | - extraction automatique de toutes les sous images nommées | + | - extraction automatique de toutes les sous images nommées |
| - concaténation (automatique) de tout les .txt en un seul fichier de ~100Mo (peut tout à fait être ouvert dans certains éditeurs de texte, pour possibilité d'un recherche full text très basique, mais suffisante dans beaucoup de cas) **(non divulgué, privé)** | - concaténation (automatique) de tout les .txt en un seul fichier de ~100Mo (peut tout à fait être ouvert dans certains éditeurs de texte, pour possibilité d'un recherche full text très basique, mais suffisante dans beaucoup de cas) **(non divulgué, privé)** | ||
| ===== outils logiciel ===== | ===== outils logiciel ===== | ||
| ==== Pour la conversion jpeg en pdf ==== | ==== Pour la conversion jpeg en pdf ==== | ||
| - | * Image Magick : magick convert @list_of_files.txt | + | * Image Magick : magick convert @list_of_files.txt |
| * img2pdf.py une alternative qui a le gros l' | * img2pdf.py une alternative qui a le gros l' | ||
| + | * aussi possible, mais lourdingue [[https:// | ||
| - | ==== Pour la conversion pdf en pdf, avec recherche de texte possible (OCR) ==== | + | ==== Pour la conversion pdf en pdf avec recherche de texte possible (OCR) ==== |
| - | Acrobat DC Pro, le problème, c'est que c'est payant, avec une facture à 200€ d' | + | Acrobat DC Pro, le problème, c'est que c'est payant, avec une facture à 200€ d' |
| Il y a aussi CVision, mais je sens que ça va couter une blinde (il faut faire une demande de devis...)\\ | Il y a aussi CVision, mais je sens que ça va couter une blinde (il faut faire une demande de devis...)\\ | ||
| pdf element a aussi l'air d' | pdf element a aussi l'air d' | ||
| - | pour générer les pdf automatiquement par répertoire | ||
| - | |||
| - | https:// | ||
| ==== Pour l' | ==== Pour l' | ||
| Ligne 55: | Ligne 53: | ||
| * génère les index, et index multi pdf. | * génère les index, et index multi pdf. | ||
| * peut aussi extraire automatiquement les images | * peut aussi extraire automatiquement les images | ||
| + | * testé sur 68 fichiers, marche bien. | ||
| + | |||
| + | |||
| choix 2 : https:// | choix 2 : https:// | ||
| * a l' | * a l' | ||
| - | * on génère un fichier d' | + | * on génère un fichier d' |
| * on fusionne (merge) tous les index en un seul | * on fusionne (merge) tous les index en un seul | ||
| * ne semble pas capable de faire pointer in pdf d' | * ne semble pas capable de faire pointer in pdf d' | ||
| Ligne 76: | Ligne 77: | ||
| http:// | http:// | ||
| + | |||
| + | ===== Conversion en .txt en batch ===== | ||
| + | |||
| + | http:// | ||
| + | |||
| + | https:// | ||
| ===== Pérennité des fichiers générés ===== | ===== Pérennité des fichiers générés ===== | ||