Archive

Archive for the ‘astuces’ Category

Créer des flux RSS grâce à Feed43

13 octobre 2010 1 commentaire

Récemment je me suis vu confronté à un nouveau problème : je cherchais des tests de boitiers PC, je vais donc sur le site revioo.com, et je vais donc voir l’actualité du monde des boitiers. Quelle ne fut pas ma stupeur (on croirait presque qu’il y a de l’action la…) de me rendre compte qu’il n’y avait pas de flux RSS spécifique à cette catégorie (bon c’est généralisable à toutes les catégories en fait, pas de racisme envers les boitiers).

J’ai donc cherché un moyen de créer un flux RSS à partir d’une page web, et voici ce que j’ai trouvé : Feed43.

Comme il n’est pas forcément très simple d’utilisation pour tout le monde, je me propose de vous faire un petit tutorial à l’aide de mon exmple précis, qui ne fonctionnera donc pas pour tout le monde, mais qui donne tout de même une idée sur la façon de faire.

Donc après avoir accepté les « terms of service » (que je n’ai pas lu, honte à moi), il vous invite cordialement (enfin aussi cordialement qu’une textbox puisse l’être) de lui fournir l’URL et l’encodage de la page.

Le code source de la page

Un clic sur le bouton « Reload » permettra l’affichage du code source de la page. C’est sur ce code source que se basera le plus gros du travail, en effet il est nécessaire de spécifier quels sont les éléments de la page qui sont intéressants et seront utilisés dans le flux RSS, typiquement le titre de la news, son URL (of course) et le résumé de la description. Info sommes toutes relativement basiques, si vous voulez l’article complet dans le flux ce n’est pas la solution qu’il vous faut, mais avouons-le pour des tests de boitiers ce n’est pas vraiment pertinent, donc je m’en contenterais.

Le choix des règles à utiliser

Donc c’est maintenant que les choses se compliquent un peu (bon pas trop quand même). Un minimum de connaissances en HTML seront nécessaires pour cette étape.

La première zone de texte permet de définir quelle sera la zone qui sera traitée par le second filtre. Il faudra donc repérer dans le code source où sont les éléments importants. Si cette zone n’est pas définie, la recherche se fera sur toute la page. La seconde quant à elle permet de définir les différents éléments constituant la news en elle même. La chaine {%} permet de définir un élément qui sera traité, {*} un élément qui sera ignoré.

Dans mon cas, voici le bout de code intéressant :

<ul class=“title_newshome”>
<li><h1><a href=“%lien_vers_la_news%” title=“%titre_de_la_news%” >
%titre_de_la_news%</a></h1>
<p><span>%date_de_la_news%</span> | %description_de_la_news%</p></li>
<li><a href=“http://www.revioo.com/news/” title=“Lire la suite de l’actualité informatique et multimédia”>[ Suite des news … ]</a></li>
</ul>

Pour simplifier, je définis ma zone d’étude par :

<ul class=“title_newshome”>{%}</ul>

(en vérifiant bien évidemment à l’avance que la zone voulue est la seule zone de ce type, sinon on devra être plus restrictif)

Les news en elles-même seront définies comme suit :

<h1><a href= »{%} » title= »{%} » >
{*}</a></h1>{*}<p><span>{%}</span> | {%}</p>

Un petit clic sur le bouton « Extract » permet de vérifier que les informations retenues sont effectivement celles que l’on souhaitaient.

Visualisation des éléments constituants le flux

On voit alors que les différents éléments sont repérés chacun par un numéro qui sera utilisé dans la dernière étape, la création du flux en lui-même. Il faut en effet lui spécifier quel élément sera utilisé comme titre, lien…

Définition du flux

Il est donc possible de vraiment parsonnaliser son flux, ce que je n’ai pas souhaité faire, préférant m’en tenir au plus simple sans aucune fioriture.

Encore une fois un bouton de prévisualisation est présent, pour vérifier qu’on obtient bien ce qu’on veut. Une URL est alors fournie pour ajouter ce flux à son lecteur préféré, ainsi qu’une URL permettant de modifier le flux, ce qui permet de le mettre à jour en cas de changement du site rssisé (ouh qu’il est laid ce néologisme) ou alors si à l’usage vous vous appercevez que quelques améliorations sont à apporter.

Finalement pour peu qu’on ait un minimum de connaissances en HTML, cette solution est assez facile à utiliser, et elle présente le gros avantage d’être extrèmement puissante, on peut vraiment traiter à peu près n’importe quel site. La plus grande difficulté étant parfois de « parser » le site, si celui-ci a été codé de manière… on va dire peu inuitive. Il est même possible que je m’en serve pour certains site auxquels je suis abonné et dont le flux ne me convient pas (article pas complet, pas d’affichage de l’image).

Catégories :astuces, Tutoriel Étiquettes :

PDF vs Word

2 août 2010 1 commentaire

Récemment on m’a demandé de fournir divers documents (CV et lettre de motivation) au format Word (ou rtf dans de rares cas) et donc étant donné la nature des documents vous devez vous douter que c’est des (grandes) entreprises qui m’ont fait ces demandes. Ceci m’a tout de même relativement surpris puisque je pensais que le format PDF était tout de même un format devenu tout ce qu’il y a de plus commun.

C’est également le même phénomène que pour la mise en ligne de son CV, sur monster par exemple on ne peut mettre son CV qu’au format .doc ou .rtf.

Les entreprises ne seraient-elles donc pas d’accord avec moi sur le fait qu’un bon PDF fasse tout de même plus propre et plus sérieux pour des documents officiels ? Et puis finalement tout le monde a sur son PC de quoi lire les PDF non ?

Et j’ai été d’autant plus embêté avec ça c’est que mon CV était fait en latex, du coup c’était un magnifique PDF (oui je sais je me lance un peu de fleurs mais ça fait jamais de mal)  et du coup j’ai été un peu embêté pour le mettre en ligne, parce que en effet y’a toujours la possibilité de faire un copier coller du texte mais bon, ça serait dire adieu à la mise en page, qui est tout de même l’un des éléments les plus importants d’un CV vous en conviendrez.

Du coup j’ai trouvé ce magnifique site : PDFtoWord. Il vous permet de lui fournit un fichier au format PDF et il se charge de le convertir en Word ou en RTF selon vos désirs et vous renvoie le résultat par mail.

On me glisse dans l’oreillette que les PDF c’est pas sûr, failles de sécurité tout ça tout ça, mais moi je me demande si c’est vraiment la raison derrière tout ça, et si c’est une raison suffisante… (un pare feu open office et on en parle plus de tout ça…)

Catégories :astuces

Astuce : console et vidéo

Me revoila pour vous faire part de quelques petites astuces pour ceux qui ne veulent pas installer d’interface graphique complète mais qui veulent tout de même effectuer quelques opérations basiques.

Tout d’abord il faut installer la lib svga donc sous Debian et ses dérivés :

apt-get install libsvga1

Alors la première astuce sera pour visionner des images dans un terminal, il suffit pour cela d’utiliser le programme zgv, il fonctionne avec les formats d’images courants comme jpg, png et gif. Ce programme est pour moi une très bonne surprise de par ses capacités, en effet lancé sans argument il se présente sous la forme d’un petit navigateur de fichier qui permet de sélectionner l’image à visionner. Il présente même des miniatures de celles-ci. Il existe aussi un support de la souris, il faut pour cela préciser le type de celle-ci dans le fichier /etc/vga/libvga.config (qui doit permettre bien d’autres choses que je n’ai pas encore pris le temps d’explorer). Il existe également de très nombreuses options qui vous permettront par exemple de redimensionner des images ou de faire un diaporama aléatoire de celles-ci. il utilise également de nombreux raccourcis claviers, je ne vous les liste pas, le man est fait pour ça.

Ensuite il existe également la possibilité de visionner vos films dans votre terminal avec le bon vieux mplayer, pour cela utiliser la commande :

mplayer -o xv:svga film.avi

Et après vous disposez de tous les raccourcis habituels du lecteur (très pratiques je trouve, pour les sous-titres mal alignés par exemples).

Il devrait également être possible d’utiliser cette librairie pour voir les images des sites web grâce au navigateur w3m avec son plugin w3m-img mais je n’ai réussi à le faire fonctionner que dans un xterm, il ne m’affiche pas les images dans un tty donc je ne vous en parlerais pas plus.

Catégories :astuces, Linux Étiquettes : , ,