Différences

Ci-dessous, les différences entre deux révisions de la page.

--- anciens_numeros:numerisation [2026/07/15 12:34]
47.128.96.82 ancienne révision (2026/06/28 09:40) restaurée
+++ anciens_numeros:numerisation [2026/07/15 12:46] (Version actuelle)
47.128.97.120 ancienne révision (2026/07/05 12:10) restaurée
@@ Ligne 35: / Ligne 35: @@
 ===== outils logiciel =====
 ==== Pour la conversion jpeg en pdf ====
-  * Le mieux [[https://gitlab.mister-muffin.de/josch/img2pdf|img2pdf.py]] une alternative qui a le gros l'avantage de ne pas recompresser les images.
+  * Le mieux, validé [[https://gitlab.mister-muffin.de/josch/img2pdf|img2pdf.py]] une alternative qui a le gros l'avantage de ne pas recompresser les images.  Validé : install Python 3.62, "pip install img2pdf".
   * Image Magick : magick convert @list_of_files.txt ldln_0nnn.pdf. Mais a le désavantage de recompresser les images.
 ==== Pour la conversion pdf en pdf avec recherche de texte possible (OCR) ====
 Acrobat DC Pro, le problème, c'est que c'est payant, avec une facture à 200€ d'office...Mais testé et ça marche bien\\
-Il y a aussi CVision, mais je sens que ça va couter une blinde (il faut faire une demande de devis...)\\
-pdf element a aussi l'air d'être un soft pro cher : https://pdf.wondershare.com/contact-sales.html\\
 Acrobat DC Pro, il est possible de traiter en bloc toute une arborescence de fichiers. La version convertie peut prendre la place du fichier d'origine.\\
 Seul problème, en cas de fichiers dans plusieurs langues, acrobat ne détecte pas automatiquement la langue. En effet, au lancement de la conversion, la langue est demandée. C'est un gros problème car cela nécessite autant de lancements manuels qu'il y a de langues.\\
+Bizarrement, au moins dans la version d'essai, le traitement est effectué sur un seul processeur. Alors que c'est là le traitement le plus lent dans la chaîne, environ 3mn par pdf... ça pourrait tourner 8x+ vite s'ils y passaient une journée...
+Autres logiciels potentiels non évalués :\\
+Il y a aussi CVision, mais je sens que ça va couter une blinde (il faut faire une demande de devis...)\\
+pdf element a aussi l'air d'être un soft pro cher : https://pdf.wondershare.com/contact-sales.html\\
 ==== Pour l'indexation ====
@@ Ligne 55: / Ligne 58: @@
   * peut aussi extraire automatiquement les images
   * testé sur 68 fichiers, marche bien.
+  * peut indexer toute une arborescence sans problème. Même en multi langues.