Différences

Ci-dessous, les différences entre deux révisions de la page.

--- anciens_numeros:numerisation [2026/05/29 16:44]
47.128.97.135 ancienne révision (2026/04/27 14:36) restaurée
+++ anciens_numeros:numerisation [2026/05/30 21:14] (Version actuelle)
47.128.97.157 ancienne révision (2026/05/19 22:33) restaurée
@@ Ligne 24: / Ligne 24: @@
   - Massicoter
-  - Scan si possible tiff 300dpi nommés ldln0nnn_ppp.tiff, sinon en jpeg 300dpi qualité maximale. **(non divulgué, privé)**
+  - Scan si possible tiff 300dpi nommés ldln_0nnn_ppp.tiff, sinon en jpeg 300dpi qualité maximale. **(non divulgué, privé)**
-  - Recadrage en batch (selon les format des ldln) avec xnview ou autres et conversion en jpeg nommés ldln0nnn_ppp.jpg **(non divulgué, privé)**
+  - Recadrage en batch (selon les format des ldln) avec xnview ou autres et conversion en jpeg nommés ldln_0nnn_ppp.jpg **(non divulgué, privé)**
   - 2 branches de Conversion
-    - en pdf classique (avec texte OCRisé) par Acrobat DC, un pdf par ldln. ldln0nnn.pdf **(non divulgué, privé)**
+    - en pdf classique (avec texte OCRisé) par Acrobat DC, un pdf par ldln. ldln_0nnn.pdf **(non divulgué, privé)**
-    - en texte brut ldln0nnn.txt et images jpg numérotées ldln0nnn_ppp.jpg **(non divulgué, privé)**
+    - en texte brut ldln_0nnn.txt et images jpg numérotées ldln_0nnn_ppp.jpg **(non divulgué, privé)**
   - réalisation d'un index complet automatiquement regroupant tout en un seul pdf chapeau. ldln_Vvvv.pdf
-  - extraction automatique de toutes les sous images nommées ldln0nnn_ppp_zz.jpg **(non divulgué, privé)**
+  - extraction automatique de toutes les sous images nommées ldln_0nnn_ppp_zz.jpg **(non divulgué, privé)**
   - concaténation (automatique) de tout les .txt en un seul fichier de ~100Mo (peut tout à fait être ouvert dans certains éditeurs de texte, pour possibilité d'un recherche full text très basique, mais suffisante dans beaucoup de cas) **(non divulgué, privé)**
 ===== outils logiciel =====
 ==== Pour la conversion jpeg en pdf ====
-  * Image Magick : magick convert @list_of_files.txt ldln_xxxx.pdf. Développé un script pour génération automatique de tous les pdf.
+  * Image Magick : magick convert @list_of_files.txt ldln_0nnn.pdf. Développé un script pour génération automatique de tous les pdf.
   * img2pdf.py une alternative qui a le gros l'avantage de ne pas recompresser les pdf
+  * aussi possible, mais lourdingue [[https://msdn.microsoft.com/en-us/library/windows/desktop/cc351041(v=vs.85).aspx#_shell_ppw_launching]]
-==== Pour la conversion pdf en pdf, avec recherche de texte possible (OCR) ====
+==== Pour la conversion pdf en pdf avec recherche de texte possible (OCR) ====
-Acrobat DC Pro, le problème, c'est que c'est payant, avec une facture à 200€ d'office...\\
+Acrobat DC Pro, le problème, c'est que c'est payant, avec une facture à 200€ d'office...Mais testé et ça marche bien\\
 Il y a aussi CVision, mais je sens que ça va couter une blinde (il faut faire une demande de devis...)\\
 pdf element a aussi l'air d'être un soft pro cher : https://pdf.wondershare.com/contact-sales.html\\
-pour générer les pdf automatiquement par répertoire
-https://msdn.microsoft.com/en-us/library/windows/desktop/cc351041(v=vs.85).aspx#_shell_ppw_launching
 ==== Pour l'indexation ====
@@ Ligne 55: / Ligne 53: @@
   * génère les index, et index multi pdf.
   * peut aussi extraire automatiquement les images
+  * testé sur 68 fichiers, marche bien.
 choix 2 : https://www.pdfindexgenerator.com/
   * a l'avantage de fonctionner en ligne de commande pour une automatisation complète. (je génère des scripts par un programme en C ou autres)
-  * on génère un fichier d'index par ldln, on prepend le numéro du ldln à toutes les entrées de l'index
+  * on génère un fichier d'index par ldln, on préfixe avec le numéro du ldln à toutes les entrées de l'index
   * on fusionne (merge) tous les index en un seul
   * ne semble pas capable de faire pointer in pdf d'index vers des sous pdfs.
@@ Ligne 76: / Ligne 77: @@
 http://www.documentsnap.com/how-to-fix-pdf-search-in-windows-7-64-bit/
+===== Conversion en .txt en batch =====
+http://www.kenbenoit.net/how-to-batch-convert-pdf-files-to-text/
+https://askubuntu.com/questions/211870/how-to-convert-all-pdf-files-to-text-within-a-folder-with-one-command
 ===== Pérennité des fichiers générés =====