total pour toute la collection
La conversion des pdf bruts en pdf OCR est totalement automatique (batch sur tous les pdf d'un répertoire)
La génération de l'index est totalement automatique (batch sur tous les pdf d'un répertoire). Elle est beaucoup plus rapide que l'OCR.
Acrobat DC Pro, le problème, c'est que c'est payant, avec une facture à 200€ d'office…
Il y a aussi CVision, mais je sens que ça va couter une blinde (il faut faire une demande de devis…)
pdf element a aussi l'air d'être un soft pro cher : https://pdf.wondershare.com/contact-sales.html
pour générer les pdf automatiquement par répertoire
https://msdn.microsoft.com/en-us/library/windows/desktop/cc351041(v=vs.85).aspx#_shell_ppw_launching
La méthode pour faire des multi pdf indexés :
choix 1 : adobe acrobat pro dc : https://helpx.adobe.com/fr/acrobat/using/creating-pdf-indexes.html
choix 2 : https://www.pdfindexgenerator.com/
Pour créer et utiliser un index (acrobat)
A connaître dans acrobat reader : crtl + shift + f permet de lancer une recherche dans tous les pdf dans un répertoire. J'ai essayé, mais je doute que ce soit utilisable pour 400+ pdf, c'est très lent, et même après la recherche, l'affichage des résultats est très lent, ce qui indique une mauvaise conception de la part d'adobe. Mais au moins, on a le contexte qui s'affiche en prévisualisation. ctrl + shift + f est aussi la commande pour lancer la recherche sur un fichier d'index, dans ce cas, ça doit être très rapide.
Il est aussi possible de laisser complètement la tache à windows. Il peut en effet indexer tous les pdf. Ca donne des recherches très rapides. Il faut ensuite ouvrir le fichier sélectionné et refaire une seconde fois la même recherche. Pour que ça marche sous win 7/8/10, il faut faire une manip dans windows.
http://www.documentsnap.com/how-to-fix-pdf-search-in-windows-7-64-bit/
Par respect de http://www.ufowaves.org/ltdsp/ltdsp/fileformats
En raison du nombre de pages assez gigantesque, un répertoire par numéro de ldln dans lequel on trouvera tout pour ce numéro. Peut poser problème pour faire l'index en auto.