[HELP]Recherche un convertisseur de fichier en ligne de commande linux

Voila sur un ftp d’une asso on a pas mal de fichier divers et collaboratifs.
Or parfois on doit acceder a ces fichier depuis un tel portable a l’arrache.

Donc le but serait de faire un demon qui passe a un programme les fichiers nouvellement créé ou modifié et que le programme les convertisse en .txt
Et donc ce serait un programme en ligne de commande sous nux.
On aurait a convertir tout le temps du excel du word du open office et eventuellement du pdf.

Le but serait d’avoir un truc qui se lance de la maniere :
convertisseur horaire.xls horaire.txt

Voila si quelqu’un connait cela et a des recommandation la dessus ce serait utile.

Merci
Bussiere

On peut très bien se connecter en FTP et lire du doc/xls/pdf à partir d’un smartphone.
Je vois pas l’intérêt du txt perso.

J’ai pas testé mais en googlant un peu je suis tombé sur cet article qui parle de antiword, catdoc et xls2csv…

Si tu as les applis payante pour de un, meme si il en existe des gratuites (quel plateforme ? gratuite partout ?).
Ensuite que pour faire du copier coller dans un sms pour un sms mailing quand on est sur un salon c’est parfois un peu relou.
Que si on fait un sms mailing lire un fichier texte de maniere informatique pour le smser a tout le monde c’est beaucoup plus simple.

Ensuite pour réutiliser de maniere informatique toute les données le txt c’est plus simple.

Bref pleins de raisons sur lesquels on s’est penché apres une orga de salon ou l’on a eu quelques problemes.

Bussiere

[quote=“plouff, post:3, topic: 52380”]
J’ai pas testé mais en googlant un peu je suis tombé sur cet article qui parle de antiword, catdoc et xls2csv…
[/quote]
Merci je vais regarder du coup ca multiplierai un peu les outils, mais ca reste jouable.

Bussiere

Connaissant la philosophie du monde Unix si tu trouves ce que tu veux ce sera probablement plutôt du 1 format binaire = 1 convertisseur, plutôt qu’un couteau suisse.

Pour les XLS/DOC, une macro qui te fabrique un fichier TXT à partir des données en table ça ne t’irait pas ? Je ne sais pas si on peut lancer une macro Excel telle quelle dans OpenOffice Calc, mais ça serait une piste.

Pour PDF, vu que c’est un format PostScript il me semble tu peux parser le fichier directement à la recherche de texte (il faut virer le formatage).
Edit : à voir la rasterisation, mais si ce sont tes propres PDF, il y a moyen de moyenner comme on dit.

Etc.

Pour chaque cas, il y aura peut-être une solution différente.

[quote=“Bussiere, post:4, topic: 52380”]
Si tu as les applis payante pour de un, meme si il en existe des gratuites (quel plateforme ? gratuite partout ?).
Ensuite que pour faire du copier coller dans un sms pour un sms mailing quand on est sur un salon c’est parfois un peu relou.
Que si on fait un sms mailing lire un fichier texte de maniere informatique pour le smser a tout le monde c’est beaucoup plus simple.

Ensuite pour réutiliser de maniere informatique toute les données le txt c’est plus simple.

Bref pleins de raisons sur lesquels on s’est penché apres une orga de salon ou l’on a eu quelques problemes.[/quote]

  • Il existe plusieurs clients FTP sur iOS. En payant c’est certain (Ftp on the go). Ca m’étonnerait qu’il n’y en ai pas de gratuit.
  • Le reste ne fait pas partit du besoin initial exprimé au début du thread.

La librairie Tika faite par Apache semble correspondre à ce que tu cherches.

Elle est même utilisable en ligne de commande d’après la doc là: doc Tika.

Le usage copié/collé:

usage: java -jar tika-app-0.9.jar [option] [file]

Options:
    -? or --help       Print this usage message
    -v or --verbose    Print debug level messages
    -g or --gui        Start the Apache Tika GUI
    -x or --xml        Output XHTML content (default)
    -h or --html       Output HTML content
    -t or --text       Output plain text content
    -m or --metadata   Output only metadata

Description:
    Apache Tika will parse the file(s) specified on the
    command line and output the extracted text content
    or metadata to standard output.

    Instead of a file name you can also specify the URL
    of a document to be parsed.

    If no file name or URL is specified (or the special
    name "-" is used), then the standard input stream
    is parsed.

    Use the "--gui" (or "-g") option to start
    the Apache Tika GUI. You can drag and drop files
    from a normal file explorer to the GUI window to
    extract text content and metadata from the files.

Les fichiers docx et xlsx (office > 2007) sont en fait des archives contenant des fichiers xml (archives ouvrables avec 7zip). Regarde si tu ne peut pas te servir de ça, pour des fichiers “simples” (sans graphiques, images, ou autre), ça devrait être faisable de récupérer les infos importantes directement dans les xml.

La commande strings (http://unixhelp.ed.ac.uk/CGI/man-cgi?strings) fait ça plus basiquement non (recherche de caractères dans un flux binaire) ?

Edit : s’il est sous Unix… sinon bien sûr Tika c’est du java donc c’est portable si je comprends bien.

Bah merci beaucoup en tout cas.
Je vais pouvoir tester tout cela.

Merci
Bussiere