Signature de blog
publié le 9/03/2010 à 23:38 - Edito
Dans PMA dans un nuage, on avait construit le nuage de mots de PMA et on y avait logiquement retrouvé les mots ‘Politique’, ‘Sarkozy’, ‘PS’ (ouf). Mais en plus de ces mots ‘évidents’, on avait remarqué la présence des mots bistro ou comete qui mettait en évidence l’aspect politique de comptoir du blog.
On s’est donc demandé, avec mon acolyte, si on pouvait identifier les mots qui caractérisent un blog, un peu comme une signature. On a été surpris nous-même par les résultats qui peuvent être vraiment pertinents comme pour PMA (encore lui
), Olympe et le plafond de verre (ou François Desouche
)…. Les thématiques abordées par ces blogs, ou les mots utilisés par les auteurs permettent de générer des nuages vraiment caractéristiques. Voila les signatures de certains blogs politiques …
Partageons Mon Avis

L’aspect politique de comptoir ressort clairement avec des mots tels que : bistro, comete, biere, comptoir, copains … mais aussi l’aspect social du blog avec des blogueurs à l’honneur : tonnegrande, falconhill, dagrouik, goux (Didier, cette fois, tu y es dans le nuage
)
Olympe et le plafond de verre

La guerre des sexes ….
Francois Desouche

Sans commentaire ….
Les privilégiés parlent aux Français et au Monde

Le blogueur en question est un enseignant, les mots qui ressortent, le prouvent …
En revanche, d’autres nuages comme celui de Peuples.net, ne semblent pas permettre (de notre point de vue) d’identifier le blog au premier regard.
Comme quoi les nuages de mots ne permettent pas de tout expliquer !
Alors vous vous demandez (enfin pas sûr, mais on va faire comme si) comment nous avons fait ! Et bien c’est assez simple, pour calculer cette signature, nous avons comparé ‘la proportion d’utilisation de chaque mots d’un blogueur’ avec ‘la proportion d’utilisation de chaque mot pour tous les autres blogueurs’. On peut le dire, ça n’a pas été de tout repos par ce que nous avons du récupérer les articles de (presque) tous les blogueurs du top 100 politique wikio. (Et ce n’est pas une mince affaire par ce qu’il faut ‘lire’ plein de formats de pages et subir les problèmes d’encodage qui font qu’on récupère des mots bizarres). On a pris quelques précautions pour éviter le bruit (on a exigé un minimum de présence du mot dans une diversité d’articles) et on a réussi à générer des nuages qui parlent d’eux-même.
Commentaires
Laissez un commentaire
Partager : Signature de blog
Lien sur votre Blog / Site
Lien pour un Forum

C’est drolement bien foutu cet outil. Marrant, car les blogs d’Olympe et Mathieu, j’aurais deviné le titre du blog en voyant les nuages de mots, je pense. Par contre, mon copain Peuple, c’est plus dur.
Bonne continuation
Tiens ! FalconHill, salut !
Je comprends pas : pourquoi mon nuage est différent du précédent ?
@Falconhill merci
Oui c’est bluffant sur certains blogs et sur d’autres …. ben juste bof :-/
@Nicolas le nuage précédent présentait les mots que tu utilises le plus. Ce nuage-ci présente les mots que tu utilises beaucoup, par rapport aux autres blogueurs. Du coup on voit bien ressortir les mots qui te caractérisent et qui permettent de te reconnaitre au premier coup d’oeil ! (Tonnegrande, bistros, comete, comptoir, etc.)
Ah ah ! Une remarque sur Nicolas : Didier y est ! Mais sous le nom de “goux”. Ce qui est somme toute logique.
@balmeyer Oui le mot “Didier” ne ressort pas dans le nuage de Nicolas car il est aussi utilisé dans d’autres contextes pour “Didier Migaud” ou “Didier Codorniou”. Goux lui est bien présent !!!
très classe ton analyse. par contre ne lisant les “méta-mots” concernant mon blog…je ne retoruve pas tellement mes thèmes chers….un truc à peaufiner peut être ?
@peuples. Oui sur ton blog, le nuage n’est pas très pertinent, on le cite justement comme contre-exemple. L’algo est surement améliorable. Je t’ai envoyé par mail le nuage de tags + classique qui lui ressort les mots que tu utilises le +. Peut-être celui-la te parlera d’avantage.