mass:numerisation

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
mass:numerisation [2026/04/14 13:18]
47.128.97.11 ancienne révision (2026/04/06 22:10) restaurée
mass:numerisation [2026/04/14 21:28] (Version actuelle)
47.128.97.133 ancienne révision (2026/04/07 19:09) restaurée
Ligne 46: Ligne 46:
 Bizarrement, au moins dans la version d'essai, le traitement est effectué sur un seul processeur. Alors que c'est là le traitement le plus lent dans la chaîne, environ 3mn par pdf... ça pourrait tourner 8x+ vite s'ils y passaient une journée...  Bizarrement, au moins dans la version d'essai, le traitement est effectué sur un seul processeur. Alors que c'est là le traitement le plus lent dans la chaîne, environ 3mn par pdf... ça pourrait tourner 8x+ vite s'ils y passaient une journée... 
  
-=== Omnipage ===+=== Nuance Omnipage ===
 Semble aussi faire l'affaire.  Semble aussi faire l'affaire. 
  
Ligne 53: Ligne 53:
 Les deux versions exploitent tous les processeurs et reconnaissent automatiquement la langue. Ainsi Omnipage résout les deux problèmes de Acrobat DC Pro, sensiblement au même prix et sans abonenment. Les deux versions exploitent tous les processeurs et reconnaissent automatiquement la langue. Ainsi Omnipage résout les deux problèmes de Acrobat DC Pro, sensiblement au même prix et sans abonenment.
  
-Version d'éval : http://www.nuance.fr/for-business/by-product/omnipage/ultimate/trial-version/index.htm+Version d'éval : https://www.nuance.com/fr-fr/print-capture-and-pdf-solutions/optical-character-recognition/omnipage/omnipage-ultimate-trial-version.html
  
-Tableau comparatif des version standard vs ultimate : http://www.nuance.fr/ucmprod/groups/imaging/@web-fr/documents/collateral/nc_017327.pdf+Tableau comparatif des version standard vs ultimate : https://www.nuance.com/content/dam/nuance/fr_fr/collateral/imaging/comparison-chart/cc-omnipagepro18-vs-ultimate-fr-fr.pdf
  
 +=== Google Vision Api ===
 +
 +Pour les petits pdfs, résultats de scans de mauvaise qualité, trop illisibles pour Nuance Omnipage, google propose une api (interface programmatique web) pour l'extraction de texte qui est beaucoup plus performante. Le résultat du traitement est un bloc de texte. Le coût est proportionnel à la quantité de données traitées
 ==== Etape 7 : l'indexation ==== ==== Etape 7 : l'indexation ====
  
Ligne 87: Ligne 90:
 === Omnipage === === Omnipage ===
  
-Possible ? +On peut aussi indexer des pdf en masse. Mais pas clair si le fichier d'index produit est compatible avec acrobat reader.
 ===== Etape 8.a : Conversion en .txt en batch ===== ===== Etape 8.a : Conversion en .txt en batch =====
  
  • mass/numerisation.1776165503.txt.gz
  • Dernière modification: 2026/04/14 13:18
  • de 47.128.97.11