SPIP - Contrib

SPIP - Contrib

[ar] [en] [es] [fr] [it]

290 visiteurs en ce moment

fontsizeup fontsizedown
[14 commentaires]

doc2img

dimanche 14 octobre 2007, par cam.lafit

  • Digg
  • Del.icio.us
  • Facebook
  • Google
  • Technorati
2 votes

Ou comment convertir des documents multipages (pdf, tiff, ...) en une succession d’images

Nota SPIP-Contrib : un plugin encore en développement, la présente documentation doit servir de support à celui-ci. N’hésitez pas à vous servir de ce forum pour remonter vos essais et avis à l’auteur.

Nota auteur : ce plugin se cherche aussi un petit nom , n’hesitez pas à proposer vos idées dans le forum

Présentation

Ce plugin a pour vocation de transformer les documents multipages (pdf, tiff, gif , ...) en autant d’images.

Par exemple, nous pouvons prendre le cas d’un journal papier, dont une version pdf existe. Il est ainsi possible :
- d’importer ce document dans un article dédié ;
- de lancer la conversion ;
- de proposer une consultation en ligne des différentes pages.

Prérequis

Ce plugin s’appuie sur la bibliothèque ImageMagick (plus de détail). Cet outil est un couteau suisse du traitement d’images.

Pour supporter le pdf, il faut aussi ghost script

Pour plus de détail sur les formats supportés à la lecture, je vous invite à consulter cette page

Il faut noter que le plugin necessite CFG.

Avertissement
Le support de SPIP 1.9.2 s’arrete avec la version 0.5 du plugin.
Les developpements actuels ne sont compatibles qu’avec SPIP 2.0 RC1 (Release Candidate 1) est sortie

Installation

Selon vos besoins et votre serveur, installez ou faites installer les logiciels nécessaire. C’est à dire :

Debian Stable (Etch)

Pour utiliser la derniere version de Ghostscript, nous devons jongler avec les paquets de la version instable (Lenny)

Mettre à jour sa liste de depot /etc/apt/sources.list :

Proteger son installation pour ne pas avoir de mise à jour non voulue en version lenny, /etc/apt/apt.conf (à créer si besoin) :

Installer la derniere version de ghostscript :
apt-get install -t lenny gs-gpl

Il est conseillé d’utiliser les paquets des polices suivantes :
apt-get install gsfonts gsfonts-other gsfonts-x11 msttcorefonts

Ressources :

Le plugin

Attention il n’y a pas de contrôle sur la présence ou non de ghost script. Pour le moment c’est à vous de vous assurer de la bonne présence des logiciels.

Telechargez le plugin sur le dépot de la zone

Suivez la procédure normale d’installation http://www.spip.net/fr_article3396.html

Jeu de test

Pour tester la qualité de la conversion de vos documents, le document en pièce jointe est à votre disposition. Ce pdf utilise un  ? et un set d’images utilisées pour les tests d’impression. Vous pouvez demander les sources (format odt) ou demander l’ajout de polices ou autres éléments.

PDF - 7.1 Mo
Pangramme : jeu de test
Un jeu de test, pour voic comment se comporte le plugin en production

Configuration

Attention L’utilisation de CFG et l’activation d’une configuration par défaut impose de desinstaller complétement toute version précédent la 0.4.

Depuis la version 0.4, une configuration par défaut est proposée.

PNG - 7.2 ko
Configuration par défaut
Le panneau de configuration et ses paramétres par défaut

format des documents On peut spécifier les documents convertibles, par défaut ce sont les formats tiff et pdf.

Repertoire de stockage Par défaut l’ensemble des documents est sauvegardé dans le repertoire /IMG/doc2img/. Ce repertoire est créé automatiquement lors de l’installation. Vous pouvez spécifier un autre repertoire, toutefois ce sera à vous de vérifier l’existence du dit repertoire. De plus il faut des droits d’écriture dessus au même titre que ceux de /IMG/

Format de sauvegarde Le format par défaut pour les images générées est le PNG. Vous pouvez préciser un autre format dans la liste déroulante. Cette liste s’appuie sur les formats supportés par SPIP.

Rédimension Par défaut les images ne sont pas redimensionnées. Elle auront donc la meme taille et resolution que celle du document original. Vous pouvez indiquer :
- soit une largeur
- soit une hauteur
- soit les 2

Proportion Si l’option proportion est cochée, le document sera redimensionné selon le plus faible ratio. C’est à dire qui si le rapport largeur réelle / largeur demandée est supérieure à hauteur réelle / hauteur demandée, l’image sera redimensionné selon le rapport defini par le ratio hauteur.

Agrandissement

Dans certains cas le pdf est sauvegardé dans un format d’impression petit (A5 ou autre), le script ne peux pas par lui meme determiner si c’est le format réel du document ou juste le format d’impression.

Pour palier à ce point, il est possible de forcer le script à prendre les tailles définies meme si celles ci sont inférieures à celle detectées par le plugin.

Convertir à la volée SI cette option est activée, lorsqu’un document est téléchargé depuis l’espace privée celui est directement convertit en succession d’images.

Utilisation

Si l’option "Convertir à la volée" n’est pas activé, il est nécessaire de sélectionner le document à convertir. Ceci se fait depuis la partie privée.

Choissisez un article pour lequel un document de type pdf ou tiff a été importé. Dans la colone de gauche, une liste déroulant est présente.

Sélection d'un document

Sélectionnez le document voulu et cliquez sur le bouton convertir. Patientez un peu, en fonction du document le temps de conversion est plus ou moins long.

Espace public

Un squelette par défaut minimaliste est disponible. Saisissez l’adresse suivante dans la barre de votre navigateur : http://votresite/?fond=doc2img

exemple d'un squelette (c) Calvin et Hobbes

Le squelette

L’idée est d’être au plus proche de la logique SPIP. Ainsi les images générées sont accessibles par un squelette quelconque.

  1. [(#REM) On liste les documents ayant été convertis]
  2. <B_listed2c>
  3.     Liste des documents
  4. <BOUCLE_listed2c(DOC2IMG) >
  5.     [(#ID_DOCUMENT|unique|?{' ',''})
  6.         <a href=#URL_PAGE{doc2img,id_document=#ID_DOCUMENT}> #ID_DOCUMENT </a>
  7.     ]
  8. </BOUCLE_listed2c>
  9. [(#REM) On navigue parmi les images d'un document]
  10. <B_d2c>
  11.     #ANCRE_PAGINATION
  12. <BOUCLE_d2c(DOC2IMG) {id_document} {pagination 1} >
  13.     <img src="#FICHIER" />
  14. </BOUCLE_d2c>
  15.     <p>
  16.     Ce document poss&eacute;de #GRAND_TOTAL page(s)
  17.     </p>
  18.     #PAGINATION{page_precedent_suivant}
  19. </B_d2c>
  20.     table vide
  21. <//B_d2c>

Comme vous pouvez le constatez le code est simple. C’est un squelette des plus basiques qui utilise la #PAGINATION pour se déplacer dans les images.

A faire

- Les traductions
- Support de la configuration (version 0.4)
- lLa génération automatique lors d’un chargement d’un doc
- suppression des images lors de la suppression du document maître
- cacher les documents deja converti dans la liste de selection de convestion
- mettre une progressbar
- tester avec php5
- support complet de l’api sql_*
- controler automatiquement les prérequis (imagick, gs, ...)

Retour en haut de la page

14 Messages de forum

Voir toute la discussion

Pages 1 | 2

  • Répondre à ce message

    27 juin 11:18 , par cam.lafit

    Bonjour

    Si vous venez d’installer la derniere version 0.9 il y a encore des bogues.
    Il n’existe pas de paquet .zip de la version dite stable.

    Ce bogue a été corrigé hier. Attention les zip sont regénéré qu’une fois par jour maintenant.

    Pour le moment il faut :

    • soit etre un peu patient le temps que tout revienne en place.
    • soit passer par svn obtenir la derniere version

    Les retours utilisateurs sont grandement demandés et appréciés.

  • Répondre à ce message

    27 juin 11:04 , par cedric couvrat

    Lorsque je lance une conversion j’ai le message suivant :

    The requested URL /sites/site-test/ecrire/doc2img_convert was not found on this server.

    Une idée pour résoudre ce problème ?

    Merci

  • Répondre à ce message

    28 décembre 2007 23:06 , par cam.lafit

    Bon[jour|soir]

    Pour accéder à la partie configuration du plugin, cela se fait :
    - depuis l’espace privé
    - en cliquant sur l’onglet "configuration"
    - ensuite en cliquant sur "CFG"
    - enfin "Gestion Doc2img"

    Quant à la liste de selection des pdf, cela se fait depuis les pages exec=articles, c’est à dire lors de la sélection d’un article et non en mode rédaction (exec=articles_edit)

    Tiens bizarre, j’ai du oublier un commit on devrait être en 0.5 :) Pour le moment c’est bien la Version : 0.4 [16695]

  • Répondre à ce message

    28 décembre 2007 22:42 , par livier

    Je me sens tout bête là ... J’ai installé et activé le plugin, version 0.4 SPIP 1.9.2b [10268], mais je ne trouve pas la page de configuration ni la petite lise déroulante dans la colone de gauche sur un article ayant déjà un pdf.

  • Répondre à ce message

    30 novembre 2007 11:01 , par cam.lafit

    Bonjour

    Si vous avais fait un plugin, dans ce cas il est mieux d’initier un nouvel article dédié :
    - ce à quoi ça sert
    - qui explique comment ça fonctionne
    - poser le tout sur SVN

    S’il y a des question sur comment faire tout ça, il est je pense plus pertinent de s’abonner à la liste de spip - zone.

  • Répondre à ce message

    29 novembre 2007 17:02 , par Patriator

    Bon me suis pondu mon petit plugin... dl fichier -> jodconverter serverside -> manip des chaines -> corps de l’article any tips sur une manière propre de conserver la mise en page sans faire apparaitre les balises HTML dans le corps de l’article (la solution de migre static est un peu light) ? any tips sur le lieu ou echanger autour de ce futur new plugin ?

  • Répondre à ce message

    24 novembre 2007 15:27 , par cam.lafit

    Bonjour

    Pour le moment ce plugin ne reponds pas à ce besoin et n’y repondra surement pas. Enfin il ne faut jamais dire jamais.

    Je vous invite à consulter cette contribution Migre static - plugin de migration d’un site qui peut deja repondre à la problématique html vers spip. Coté bureautique vers html, il existe surement des outils je pense entre autre à ooconverter (je ne sais pas si cela existe encore).

    La question reste ouverte, c’est peut etre le debut d’un nouveau chantier :)

  • Répondre à ce message

    23 novembre 2007 23:31 , par Patriator

    Bonjour, ne trouvant de place appropriée dans les forums et trouvant ma recherche assez proche de ce plugin, je vous expose mon cas :
    - des rédacteurs ayant déjà, pour la plupart tapé les articles dans des documents de type bureautique...

    J’aurais aimé quelque chose de plus souple qu’une transformation en image. pensais à quelque chose type : dl le fichier, transformation en html, recup du contenu pour le faire passer dans le corps de l’article (pourquoi pas gestion des images) et optionnellement transformation en pdf pour joindre le fichier à l’article.

    Cela vous parrait-il saugrenu ? ai-je loupé un plugin qui ferait cela ? ce présent plugin peut il convenir ?

    Dans le cas ou je développerais ce plugin, quelle forme lui donner pour qu’il intéresse le maximum de gens ?

    Merci de votre attention.

  • Répondre à ce message

    22 octobre 2007 14:59 , par cam.lafit

    Bonjour

    En effet peut etre bon à rajouter.
    Avec le en version 193, on oublie que ce controle ne se fait pas tout seul dans les versions précedentes de SPIP.

  • Répondre à ce message

    22 octobre 2007 14:44 , par cedricici

    Bonjour, il serait peut-être interessant de préciser sur cette page que CFG est nécéssaire pour ce plugin ;-) (car le mot clé "avec CFG" je l’avais un peu zappé).

    Très bien sinon...

Pages 1 | 2

Répondre à cet article

Retour en haut de la page

Ça discute par ici

SPIP | Squelette | | Plan du site | Suivre la vie du site RSS 2.0