Reglamento general de los foros   •   FAQ   •   Buscar en el foro •  Registrarse | Iniciar sesión 



Portada » Foros Linux » General » Software


Nuevo tema Responder al tema
 [ 3 mensajes ] 
Patrocinadores

Autor
Buscar:
Mensaje

Desconectado
Forista Nuevo
Forista Nuevo

Registrado: Jue Nov 05, 2015 2:22 pm
Mensajes: 2

Nota Publicado: Jue Nov 05, 2015 2:27 pm 
Arriba  
Hola,
ando buscando algo de ayuda para hacer un pequeños script.
tengo una estructura de directorios tal que asi: PDF\entrada\li ... lin
es decir, dentro de entrada hay varias carpetas e incluso subcarpetas que contiene ficheros .pdf.

Quiero hacer un script que para cada fichero que encuentre , le pase
un ocr y lo mueva a una nueva carpeta, manteniendo la esstructura de origen: (PDF\salida\li...ln)

como ocr voy a utilizar pdfocr, y su sintaxis basicamente es pdfocr -i inputFILE -o outputFILE.

¿Como podria automatizar este proceso para todos los pdfs del directorio?

Desde ya muchas gracias

 Perfil  

Desconectado
Forista Ancestral
Forista Ancestral
Avatar de Usuario

Registrado: Mié Ago 11, 2010 10:32 am
Mensajes: 3234
Ubicación: Oviedo-es_ES

Nota Publicado: Jue Nov 05, 2015 3:22 pm 
Arriba  
es encomiable lo de querer hacer pequeños scripts pero, en mi opinión personal, el OCR en Linux está muy poco desarrollado y, como tampoco creo que lo hagas todos los días, yo te sugeriría que, para esto que dices, en vez de complicarte la vida, lo hagas uno a uno, manualmente... que tya de por si tienen 'bastante tela'

Por otro lado, yo no se si 'pdfocr' es un programa desarrollado para Windows (al menos yo no lo tengo en los repositorios de Debian, ni aparece nada en su web) y, desde luego, parece poco potente. De usar un programa para Windows, yo te sugeriría Abbyy FineReader, que al menos la versión de hace 3 o 4 años funcionaba perfectamente (incluso sus versiones 'portables') a través de Wine... si eres partidario de este invento.

 Perfil WWW  

Desconectado
Forista Nuevo
Forista Nuevo

Registrado: Jue Nov 05, 2015 2:22 pm
Mensajes: 2

Nota Publicado: Vie Nov 06, 2015 10:09 am 
Arriba  
Hola doc,
gracias por tu aportación: no te falta razón.
el problema es que si es una carga de trabajo elevada, ya que el circuito con los escaneos es algo más largo:
Escaneo - OCR - Split - Renombrar cada pdf generado.

El pdfocr es bastante casposo, pero me vale para pasarle despues los ficheros generados a una aplicación en windows que los renombra, detectando un patrón de texto dentro del PDF.

Gracias

 Perfil  
Mostrar mensajes previos:  Ordenar por  
 [ 3 mensajes ] 
Nuevo tema Responder al tema

Saltar a:  


 Temas relacionados   Autor   Respuestas   Vistas   Último mensaje 
Problemas al crear script

en Sistema

mariodistorsion

2

682

Vie Dic 26, 2014 10:54 pm

mariodistorsion Ver último mensaje

Crear script SOLUCIONADO

en Programación

AlexDragón

4

1112

Jue May 10, 2012 7:48 pm

Deckon Ver último mensaje

crear script replique log

en Programación

joseelmas

2

844

Sab Feb 16, 2013 2:15 am

maiku Ver último mensaje

crear variable global en script

en Programación

antopv

9

3279

Mié Ene 27, 2010 4:41 pm

maiku Ver último mensaje

Crear un lanzador de terminal en Lubuntu (script)

en Sistema

donndaldarko

2

1428

Vie Jul 31, 2015 12:36 pm

neurus Ver último mensaje



¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 1 invitado

No puede abrir nuevos temas en este Foro
No puede responder a temas en este Foro
No puede editar sus mensajes en este Foro
No puede borrar sus mensajes en este Foro
No puede enviar adjuntos en este Foro

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group :: Style based on FI Subice by phpBBservice.nl :: Todos los horarios son UTC + 1 hora [ DST ]
Traducción al español por Huan Manwë
phpBB SEO