dividir un PDF en varias páginas [Solucionado]

Dudas y comentarios relacionadas con paquetes o programas específicos (obtención, uso, actualizaciones, versiones, problemas de instalación, etc.)

Moderadores: doc, Deckon

Responder
Avatar de Usuario
doc
Forista Ancestral
Forista Ancestral
Mensajes: 3304
Registrado: Mié Ago 11, 2010 10:32 am
Ubicación: Oviedo-es_ES
Contactar:

dividir un PDF en varias páginas [Solucionado]

Mensaje por doc » Sab Mar 07, 2015 12:09 pm

a ver si me explico bien, que estoy 'en plena investigación' y tengo todavía que aclarar ideas, este fin de semana. Se trata de lo siguiente: si capturo una página web larga (de las que hay que hacer 'scroll' porque no cabe en la pantalla), por ejemplo con el Complemento (Extensión) Screengrab, me sale una imagen muy alargada. Si la convierto a PDF, solo me sale una página, evidentemente muy alargada.

Lo que quiero es partir esa página en dos, tres, o las que sean, para que me encaje bien en papel A4. Estoy viendo un programilla (perdón, aplicación) un poco 'rarilla' (funciona en Java) que se llama 'PDFScissors' que si, lo puede cortar en varias páginas, pero hay que hacerlo manualmente, y es un poco incómodo.

Y la pregunta es... ¿alguien conoce algo parecido... y más cómodo?
Última edición por doc el Sab Mar 07, 2015 8:41 pm, editado 1 vez en total.
Avatar de Usuario
cargoan
Forista Medio
Forista Medio
Mensajes: 281
Registrado: Dom Oct 19, 2014 6:26 pm

Re: dividir un PDF en varias páginas

Mensaje por cargoan » Sab Mar 07, 2015 7:03 pm

... y no es más fácil hacerlo directamente desde la página? Con wkhtmltopdf es muy fácil:

Código: Seleccionar todo

$ wkhtmltopdf http://www.espaciolinux.com/foros/ ejemplo.pdf
el resultado:
Imagen
«La simplicidad es la máxima sofisticación» L. da Vinci
Arch Linux 64 (liquorix+BFS)
Avatar de Usuario
doc
Forista Ancestral
Forista Ancestral
Mensajes: 3304
Registrado: Mié Ago 11, 2010 10:32 am
Ubicación: Oviedo-es_ES
Contactar:

Re: dividir un PDF en varias páginas

Mensaje por doc » Sab Mar 07, 2015 7:31 pm

¡connio...! ¡'Ferpecto'...!
(ni Complementos ni puñetas. Con instalar ese comandito, o paquete, me vale). Mil gracias, cargoan.

Ahora me voy a poner a investigar cómo puedo hacer para crearme un lanzador en el escritorio (bueno, mejor en el Panel) que me ejecute el wkhtmltopdf, si es posible que me tome la pestaña (del Iceweasel) activa (o si no que me pida que la copie y pegue), y ya, en plan virguero, que me pida el nombre y ruta donde quiera guardar el PDF que me cree (o configurarle una ruta predeterminada (por ejemplo en el Escritorio), y que solo me pida el nombre... y lo dejo 'planchao'.

¿existirá algún GUI de wkhtmltopdf? ¿o quizás lo que digo se puede poner en un script que te lo automatice?
(como no tengo ni pugnetera idea de programación... se agradecen las ayudas) :D :D
Avatar de Usuario
neurus
Forista Legendario
Forista Legendario
Mensajes: 1807
Registrado: Dom Oct 10, 2004 7:00 am

Re: dividir un PDF en varias páginas

Mensaje por neurus » Sab Mar 07, 2015 8:09 pm

pdftk puede servir para eso. Si lo prefieres gráfico, hay un frontend llamado pdftk4all.

Por otra parte, si en lugar de capturar la página de ese modo, simplemente la imprimes a un archivo:


Imagen

y configuras la impresión para hojas a4:


Imagen

Te queda un archivo postscript, perfectamente compatible con cualquier lector pdf, impreso en el tamaño de página que prefieras.

En cuanto a pdftk, si lo que quieres es un script, sería tan sencillo como

Código: Seleccionar todo

#!/bin/sh
pdftk $1 burst output $2%02d.pdf
Digamos que el script se llama dividir.sh:

dividir.sh tuarchivo.pdf directorio/nombre (sin extensión).

Y el resultado sería que en el directorio indicado, aparecerían varios archivos del tipo: tuarchivo01.pdf, tuarchivo02.pdf, etc.
Si además quieres que todas las páginas salgan en un sólo archivo, entonces habría que agregar una línea al script, así:

Código: Seleccionar todo

#!/bin/sh

TEMP=`mktemp -d`
pdftk $1 burst output $TEMP/$2%02d.pdf
pdftk $TEMP/$2* output $3
Y lo usarías así: dividir.sh tuarchivo.pdf nombretemporal archivofinal

Lo del nombre temporal, puede ponerse como una constante en lugar de tener que escribirlo cada vez. Pero te queda como tarea. En este último script no verías los archivos del tipo archivo1.pdf archivo2.pdf (se crean en un directorio temporal).
Última edición por neurus el Sab Mar 07, 2015 8:22 pm, editado 2 veces en total.
Avatar de Usuario
cargoan
Forista Medio
Forista Medio
Mensajes: 281
Registrado: Dom Oct 19, 2014 6:26 pm

Re: dividir un PDF en varias páginas

Mensaje por cargoan » Sab Mar 07, 2015 8:31 pm

doc escribió:...
¿existirá algún GUI de wkhtmltopdf? ...
https://code.google.com/p/foxoman/wiki/HTMLtoPDF

Imagen
«La simplicidad es la máxima sofisticación» L. da Vinci
Arch Linux 64 (liquorix+BFS)
Avatar de Usuario
doc
Forista Ancestral
Forista Ancestral
Mensajes: 3304
Registrado: Mié Ago 11, 2010 10:32 am
Ubicación: Oviedo-es_ES
Contactar:

Re: dividir un PDF en varias páginas

Mensaje por doc » Dom Mar 08, 2015 12:17 pm

juerrrr... aún más sencillo. Y yo, comiéndome el coco como un tontín.

Nada, que el que sabe... sabe. Gracias, maestros. Lo voy a dar por solucionado

Neurus, lo del pdftk lo tenía apuntado para estudiármelo con calma, la verdad es que parece una aplicación por consola muy potente. Desgraciadamente, no he visto en la paquetería de Debian el frontend 'pdftk4all'. Lo que dices de la opción 'burst' ¿no es para dividir, pero 'hoja por hoja', un PDF de varias páginas? (esto yo lo solía hacer, aunque esto es más directo, con PDFShuffler). Algún día 'investigaré' un poco sobre el PDFTK

Pero lo de imprimir 'como archivo PDF' una página web, es justo lo que quería: si es larga (hay que hacer scroll) te lo saca, automáticamente, en varias páginas, como pretendía (y no hace el Complemento 'ScreenGrab')

(ahora estoy investigando sobre el PDFScissors y, sobre todo, sobre otra aplicación que encontré, también basada en Java, que se llama Briss, y que tiene buena pinta, permite recortar bastante cómodamente por ejemplo las cabeceras, los márgenes o la información de un marco lateral, y dejar el PDF de la web 'solo con lo que me interese'. Incluso, al parecer, sirve también para dividir automáticamente, en páginas separadas, aquellos PDFs que son de 2 páqinas por hoja (por ejemplo al fotocopiar libros)... así que tengo un bonito fin de semana para investigar.
Y, si llego a conclusiones 'prácticas', lo pondré en mi Blog.

Venga, lo dicho: gracias, maestros.


Añado:
sorry, cargoan, no había visto tu post. Gracias, es también perfecto ese GUI de HTML to PDF Converter. Justo lo que pedía.
Puff, ya tengo mucho material para 'profundizar...'
:good: :drinks:

EDITADO
Por cierto, cargoan, me es imposible instalar el 'html2pdf_1.0-1_all.deb' ese, ni con GDebi ni con nada. ¿Quizás use unas librerías ya en desuso en mi Debian Jessie-Cinnamon? (veo que el paquete es de 2011) ¿alguna idea...?
Avatar de Usuario
cargoan
Forista Medio
Forista Medio
Mensajes: 281
Registrado: Dom Oct 19, 2014 6:26 pm

Re: dividir un PDF en varias páginas [Solucionado]

Mensaje por cargoan » Dom Mar 08, 2015 1:40 pm

En arch se instala desde ese mismo paquete deb.
Quizá te falte alguna dependencia, en arch son: wkhtmltopdf, python2, python2-gobject, python2-notify. No sé en debian a a qué paquetes corresponderán... por si te sirve de pista.

... siempre te queda la opción de extraer los archivos y revisar los scripts del paquete, por si acaso hay que ejecutar algo además de copiar los archivos.
«La simplicidad es la máxima sofisticación» L. da Vinci
Arch Linux 64 (liquorix+BFS)
Avatar de Usuario
doc
Forista Ancestral
Forista Ancestral
Mensajes: 3304
Registrado: Mié Ago 11, 2010 10:32 am
Ubicación: Oviedo-es_ES
Contactar:

Re: dividir un PDF en varias páginas [Solucionado]

Mensaje por doc » Dom Mar 08, 2015 2:32 pm

cargoan escribió:En arch se instala desde ese mismo paquete deb.
Quizá te falte alguna dependencia, en arch son: wkhtmltopdf, python2, python2-gobject, python2-notify. No sé en debian a a qué paquetes corresponderán... por si te sirve de pista.

... siempre te queda la opción de extraer los archivos y revisar los scripts del paquete, por si acaso hay que ejecutar algo además de copiar los archivos.
pufff... 'demasié p'al body'...

bueno, digo yo que siempre puedo pensar cómo crearme un script sencillito para usar por consola el 'wkhtmltopdf', y que me diga eso de 'introduce la web a convertir' y luego 'introduce el nombre del archivo PDF'.
Investigaré, que yo de programación... N.P.I
Avatar de Usuario
cargoan
Forista Medio
Forista Medio
Mensajes: 281
Registrado: Dom Oct 19, 2014 6:26 pm

Re: dividir un PDF en varias páginas [Solucionado]

Mensaje por cargoan » Dom Mar 08, 2015 4:13 pm

pero si es muy fácil hombre, copia el deb a un directorio de trabajo y desde allí:

Código: Seleccionar todo

$ ar x html2pdf_1.0-1_all.deb
$ tar xvf data.tar.gz
$ sudo cp -rp usr/* /usr
y ya está instalado. No hay que hacer nada más, no hay scripts en el paquete.

Este es el archivo de control del deb, puede que las dependencias sean para ubuntu y que en debian sean otros nombres
source: html2pdf
Package: html2pdf
Version: 1.0-1
Architecture: all
Maintainer: foxoman <foxoman.googlecode.com>
Installed-Size: 60
Depends: wkhtmltopdf, python, python-glade2, python-gtk2, python-gobject, python-notify
Section: graphics
Priority: extra
Description: PyGTK frontend for WkHTMLtoPDF to convert HTML to PDF
PyGTK frontend for WkHTMLtoPDF to convert HTML to PDF .
«La simplicidad es la máxima sofisticación» L. da Vinci
Arch Linux 64 (liquorix+BFS)
Avatar de Usuario
doc
Forista Ancestral
Forista Ancestral
Mensajes: 3304
Registrado: Mié Ago 11, 2010 10:32 am
Ubicación: Oviedo-es_ES
Contactar:

Re: dividir un PDF en varias páginas [Solucionado]

Mensaje por doc » Dom Mar 08, 2015 6:07 pm

cargoan escribió:pero si es muy fácil hombre, copia el deb a un directorio de trabajo y desde allí:

Código: Seleccionar todo

$ ar x html2pdf_1.0-1_all.deb
$ tar xvf data.tar.gz
$ sudo cp -rp usr/* /usr
y ya está instalado. No hay que hacer nada más, no hay scripts en el paquete.
...
caramba, perfecto...
yo no se donde habeis estudiado estas cosas los usuarios 'Pro' pero, nada, hice un 'acto de fe', apliqué lo que dices y luego, sin más que editar el Menu (vamos, el 'alacarte' de Cinnamon), y...
- añadir un item,
- ponerle como mandato 'html2pdf'
- poner el icono correspondiente
bueno, esto...
Imagen

me ha quedado 'planchao'.

Imagen


(escribo todo esto para acordarme, dentro de unos días lo pondré en mi Blog, que lo uso como 'repositorio de ideas interesantes'. Y es que tengo muy claro que, de las tres especies de usuarios de Linux (usuarius communis, usuarius habilis y usuarius sapiens) yo nunca evolucionaré a 'sapiens'... y como nunca me voy a aprender los comandos avanzados de memoria... el Blog me sirve para tener a mano los 'apuntes tácticos' que voy sacando para hacer ciertas cosas).
Y si así les sirve para otros 'u. communis' o 'u. habilis'... pues tanto mejor.

Gracias, cargoan.
Avatar de Usuario
cargoan
Forista Medio
Forista Medio
Mensajes: 281
Registrado: Dom Oct 19, 2014 6:26 pm

Re: dividir un PDF en varias páginas [Solucionado]

Mensaje por cargoan » Dom Mar 08, 2015 6:25 pm

bueno, el archivo desktop para el menú ya viene en el paquete (/usr/share/applications/html2pdf.desktop)

Código: Seleccionar todo

$ cat /usr/share/applications/html2pdf.desktop
[Desktop Entry]
Version=1.0
Encoding=UTF-8
Terminal=false
Name=HTML to PDF converter
Type=Application
Comment=convert html to pdf
Exec=html2pdf
Icon=html2pdf
Categories=Utility;Application;
seguramente bastaba con actualizar el menú.
«La simplicidad es la máxima sofisticación» L. da Vinci
Arch Linux 64 (liquorix+BFS)
Responder
  • Similar Topics
    Respuestas
    Vistas
    Último mensaje