apluggedinlife.com

Pour ce premier vrai article, j'avais envie de présenter une communauté que j'aime bien : celle de la BD hispanophone, plutôt côté Espagne. A partir de sources que je suis régulièrement, j'ai donc tenté une petite exploration et réalisé quelques cartes pour essayer d'appréhender un peu la structure de cette communauté, de mettre à jour les relations qui peuvent exister entre quelques portails et blogs de ce domaine.

Périmètre de l'étude

Un total de 931 sites (564 sites + 367 appartenant au réseau WEE, Webcómics en español) en langue espagnole et de préférence issus d'Espagne ou dont les auteurs sont espagnols.

Je me suis penchée sur cette communauté pendant 2 jours, les 30 et 31 janvier.

4 outils, des logiciels libres et open source

L'outil qui a rendu possible cette fouille. Il se présente sous la forme d'une extension Firefox (compatible Firefox 3.6) et a la particularité d'associer navigateur et crawler. Une fois mis en route, il analyse les pages au fur et à mesure de la navigation, détecte les liens hypertextes et offre la possibilité de les classer via la création de libellés. Il produit ainsi des graphes sous forme de données exploitables avec des logiciels de visualisation et d'analyse de réseaux tels que Guess, Pajek ou Gephi.

C'est un outil dont la prise en main est facile et rapide. Cela dit, je pense qu'il ne faut tout de même pas hésiter à s'attarder sur la documentation mise à disposition car elle est intéressante. Le guide méthodologique qui peut paraître indigeste (70 pages), est très complet et utile. Les explications sont riches d'exemples pratiques et replacent l'utilisation de l'outil dans un contexte théorique (théorie des agrégats, présentation du modèle en couche, de la morphologie d'un domaine etc.).

Gephi

Le logiciel choisi pour visualiser et manipuler les données collectées avec Navicrawler. Les principales cartes ci-dessous ont été produites à partir de la version 0.6 de Gephi. Depuis, une version 0.7 a vu le jour et pour m'être un peu amusée avec, je la trouve très prometteuse ! L'interface de Gephi est très intuitive. Le logiciel met à disposition, entre autres, des algorithmes de spatialisation et de nombreuses fonctionnalités d'édition permettant d'optimiser la cartographie de réseaux. Pour avoir un aperçu et/ou démarrer, je vous invite à aller jeter un œil aux vidéos et à la démo disponible.

Flem

Firefox Links Explorer Module, est un module Firefox qui permet d'importer et de gérer une liste d'URL. Très commode pour travailler à partir d'un corpus d'URL, il offre la possibilité d'importer dans une toolbar une liste de liens depuis n'importe quel fichier texte (Excel, .txt, .csv, HTML etc.) et de naviguer de liens en liens facilement.

Flagfox

Autre module Firefox qui affiche le drapeau du pays où est situé le serveur du site parcouru. En complément de la consultation des éventuels profils renseignés, c'est une extension utile pour avoir une idée de l'origine géographique des sites que l'on visite.

Méthodologie

Les points d'entrée sont une liste d'une cinquantaine de portails d'information et de blogs BD auxquels je suis syndiquée. Pour élargir ce corpus de sources, j'ai simplement exploré manuellement les blogrolls et les liens recommandés présents sur les pages d'accueil des sites. En procédant, j'ai tenté de privilégier au maximum les sources hispanophones d'Espagne et ce, jusqu'à l'obtention d'un nombre suffisant de sites (comprendre : jusqu'à ce que mes activités navicrawlesques fassent grimper Firefox à près d'1 Go de mémoire utilisée et que tout plante généreusement !).

Au fil de la navigation, j'ai qualifié une à une les sources sélectionnées selon 9 critères : auteurs, éditeurs, associations & fédérations, magazines & fanzines, comics, manga, information & chronique, événements, réseau WEE (traité à part).

La spatialisation et la manipulation des données ont ensuite été effectuées grâce à Gephi.

Précisions sur les cartes

Les noeuds représentent les sites Web (ou au niveau macro, les catégories identifiées ci-dessus) et les arcs sont les liens hypertextes entre eux.

Le diamètre de chacun de ces noeuds dépend du nombre de liens pointant vers eux (plus un site a de liens entrants, plus le noeud correspondant est gros).

Comme le Navicrawler définit un site par « l'ensemble des pages qui partagent le même nom de domaine » (c.f documentation) et que par conséquent il ne fait pas la distinction entre 2 sites hébergés sous un nom de domaine similaire (exemple : http://www.bloj.net/aitor/ et http://www.bloj.net/entrari/ sont http://www.bloj.net/ pour Navicrawler), j'ai tout bonnement choisi de ne pas prendre en compte ce type de sites pour éviter toute confusion.

Les cartes ne sont donc pas exhaustives. Elles ne font état que d'un échantillon de sites du domaine. Elles n'ont pas non plus été dressées à partir du crawl intégral de l'ensemble des sites. L'analyse des liens hypertextes porte uniquement sur les pages d'accueil (incluant blogrolls).

En raison de soucis techniques, les blogs affiliés au réseau WEE ont été traités séparément et ne figurent pas sur la même carte que le reste des sites dédiés à la BD.

Vous l'aurez compris, cette petite expérience d'exploration et de cartographie ne constitue qu'une première approche. Du fait de son caractère partiel, il faut donc relativiser ses résultats. Il s'agit d'une vision du domaine sans grande prétention si ce n'est celle d'avoir une ébauche de sociogramme de cet environnement.

Cartographies et analyse

Aspect global selon les catégories de sites identifiées

Proportion globale

La majeure partie des sites répertoriés sont des sites d'auteurs. Dessinateurs, scénaristes, coloristes, amateurs ou professionnels représentent ainsi plus de 55% du total des sites visités. Viennent ensuite les portails d'information spécialisés, les blogs de passionnés, de critiques (12%), les magazines en ligne et les différents sites de fanzines (10%). En mineur, on retrouve ensuite les portails et blogs parlant de Mangas, d'animes, de cosplay (8%), les sites Web d'éditeurs (6%), ceux portant sur les Comics, les super héros (5%), les portails dédiés aux événements, aux salons et diverses rencontres autour de la BD (3%), ainsi que quelques sites d'associations, de fédérations et de centres (1%).

Distribution des liens hypertextes entre les différents ensembles

On le voit à l'épaisseur des arcs, les différentes catégories de sites représentées sont globalement très interconnectées. On observe néanmoins une plus faible densité de liens, c'est-à-dire moins de références entre les blogrolls des sites News, reviews, Publishers, Events et Associations, federations. Il en est de même entre les groupes Magazines, fanzines, Comics, Events et Manga. Attention toutefois car cette connectivité moindre peut également être imputée en partie à la méthodologie de crawl adoptée. Pour rappel, celui-ci a été effectué uniquement sur les pages principales des sites. Or, beaucoup de sites des catégories abordées ci-dessus ont davantage de contenus statiques à vocation informative et commerciale et leurs liens recommandés sont, en général, peu mis en avant sur la page principale. Il se peut donc également que ces liens n'aient tout simplement pas été pris en compte.

Carte détaillée des sites référencés

Changement d'échelle ici pour venir s'intéresser de plus près aux sites qui forment les ensembles décrits précédemment. Le résultat est une carte très touffue qui montre une concentration importante de liens entre les différentes pages Web visitées (plus de 5600 arcs, en moyenne 19 liens entrant+sortants). Cette densité de liens hypertextes montre à quel point les relations entre les acteurs peuvent être étroites. Ils se référencent volontiers les uns les autres par blogrolls interposées.

D'un point de vue général, on voit émerger de cette toile d'araignée une dizaine de sites de part leurs nombres importants de liens entrants et sortants : Entrecómic (198 liens), La Cárcel de Papel (193), DR que erre (127), Trazo, Línea, Mancha (126), Es muy de cómic (126), Lo Pitbull (103), Cretinolandia (102), A uno que le dio por dibujar (98), Flora y Fauna (90), El Tebeonauta (89).

Au vue du nombre de liens hypertextes qui pointent vers eux, les sites La Cárcel de Papel (156), Entrecómic (102), Zona Negativa (71), Cretinolandia (59), Ediciones Glénat (56) et A uno que le dio por dibujar (53), semblent notamment faire office de références dans le domaine. Ils sont présents dans de nombreuses blogrolls.

Si l'on se concentre sur chaque catégorie identifiée, on peut voir qu'au sein d'Authors les sites les plus liés sont DR que erre (127), Trazo, Línea, Mancha (126), A uno que le dio por dibujar (98), El Tebeonauta (89), Manuel Bartual weblog (81), Ombligopolis (76), Le mystère Nemo (74), El riquiblog (72), Neochema (71), pour n'en citer que quelques uns.

Focus sur les sites des auteurs

Les sites d'information et de chroniques sur la BD sont eux aussi fortement interconnectés. Se démarquent Entrecómic (198), La Cárcel de Papel (193), Es muy de cómic (126), Flora y Fauna (90), El show de los hombres lobos (85), Desde mi mundo (73), Zona Negativa (71) et El lector impaciente (70).

Focus sur les sites d'information et de chroniques sur la BD

Sur la thématique Manga, on constate également une concentration de liens. Paradise Library (75), Miyaland (66), La estantería de Cho (64), Una pareja otaku (55), Hablemos de shonen (45) en comptent le plus.

Focus sur les sites sur la thématique Manga

Chez les magazines et fanzines en ligne, les sites sont aussi très liés. Ceux qui se distinguent sont Lo Pitbull (104), Cretinolandia (102), Rantifuso (54), Ferran Esteve (47), HUMcomics (38)

Focus sur les sites de magazines et fanzines en ligne

Un peu moins de liens entre les sites traitant de Comics. Les plus reliés étant toutefois El blog de Jotace (71), El noveno arte (46), Mis cómis (43), Los archivos de Typhares (39)

Focus sur les sites traitant de Comics

Très peu de liens entre les sites événementiels. Salon del Manga de Andalucia (50), Expocómic (27), Ficomic (19) sont ceux qui ressortent le plus.

Focus sur les sites événementiels

Au niveau des sites des éditeurs, seul le site Ediciones Glenat (57) ressort.

Focus sur les sites des éditeurs

Concernant les sites d'associations, de fédérations et de centres, ceux qui totalisent le plus de liens sont Asociación profesional de ilustradores de Madrid (44), Escalojoso centre de cómic (43) et Asociación Malavida (34).

Focus sur les sites d'associations et de fédérations

Sur une carte à part, le réseau WEE montre un volume de liens important. En dehors du portail qui polarise logiquement une grande quantité de liens (261), la cartographie des 367 sites de ce réseau révèle également une dizaine de site centraux parmi lesquels figurent Comics en blog (60), Lakame House (46), Oseano (45), El Listo comics (42), Sergio en Internet (41), Las crónicas PSN(40), Runtime cómics (39), Muerte querida (36), Wargo Comepx (36), Pardillos (33)

Focus sur les sites du réseau Webcómics en español

Voilà. Bien que cette petite étude soit assez rudimentaire, beaucoup de commentaires pourraient encore être ajoutés tant il y a matière. Ce type de cartographie est en effet intéressant, pour comprendre notamment les relations d'un site avec les autres et plus globalement, pour avoir une idée des dynamiques possibles de circulation de l'information dans un environnement donné.

Si ça vous intéresse, que vous avez envie de partager d'autres d'outils, méthodologies, réflexions, laissez-nous vos commentaires, on sera content d'en apprendre plus.

En attendant et pour le cas où tout ceci aurait fini par piquer votre curiosité, je mets tous mes sets de données à votre disposition. N'hésitez pas à vous y plonger !

Sets de données