Bonjour à tous,
Je vois passer depuis quelque jour des discussions sur les Fake News, j'en
profites pour passer l'info, si certains d'entre vous se trouvent vers
Rennes les 14 et 15 mai :)
Fake ou pas Fake ?
Hackathon CORIA-TALN 2018
(hackathon en recherche d’information et traitement automatique des langues)
Résumé
Tâches : détection et visualisation de fausses informations sur les réseaux
Site web :
http://hackatal.github.io/2018
Dates : 14 et 15 mai 2018
Lieu : IRISA, Rennes
Inscription (gratuite mais obligatoire) :
https://goo.gl/forms/soTeFTikjWol8bj13 !
Description
Dans le cadre de la conférence CORIA-TALN-RJC 2018 est organisé un
hackathon, 3ème édition côté CORIA (Hack Days) et TALN (HackaTAL).
L’évènement porte sur des problématiques en RI et en TAL. L’objectif est de
réunir les communautés scientifiques, et au delà, autour de défis à
relever, pour modéliser, prototyper, coder, expérimenter, développer,
tester, évaluer, échanger, etc. - par équipes, dans une ambiance
décontractée :) !
Les tâches proposées portent cette année sur la détection et le traitement
d’informations manifestement fausses, un sujet de préoccupation pour les
médias et citoyens. Ces problématiques, nouvelles pour la société de
l’information, soulèvent de nombreuses questions et nous essaierons de voir
si des traitements RI et TAL peuvent y répondre, pour mieux comprendre les
phénomènes en jeu et y réagir, plus rapidement et de manière plus adéquate,
à l’aide d’algorithmes du domaine.
Un jeu de données sera fourni par la société Storyzy sur la thématique de
la vaccination, qui est un sujet occasionnant la diffusion de nombreuses
fausses nouvelles. Il contiendra des textes provenant de divers sites web
en anglais et en français, ainsi que des transcriptions automatiques de
vidéos sur cette même thématique.
L’événement est ouvert à tous (informaticiens, linguistes, journalistes),
ne nécessite aucune préparation particulière et ne requiert pas de
compétences spécifiques aux tâches que nous proposons... tout le monde est
bienvenu !
Tâches
1. Détection : repérer et catégoriser les fausses informations
Objectifs
Parmi les informations disponibles en ligne certaines sont manifestement
fausses et il n’est pas évident de faire la part des choses, autant pour
les médias, entreprises ou laboratoires (notamment à cause des volumes de
données à traiter), que pour les citoyens : quels indices caractérisent les
fausses informations ? L’objectif de cette tâche est de voir si des
algorithmes TAL et RI sont capables de détecter et catégoriser finement ces
fausses informations.
Sous-tâches
- parmi un ensemble de textes, déterminer automatiquement lesquels sont des
faux (contrefactuels, détournés, trompeurs, parodiques),
- catégoriser les fausses informations parmi un ensemble de catégories
prédéfinies (sites propagandistes, conspirationnistes, pseudo-science,
satires),
- caractériser les faux d’un point de vue linguistique : quels modes
d’expression, quelles tournures sont utilisées pour propager de fausses
informations.
2. Visualisation : agrégation des fausses nouvelles pour une vision
synthétique
Objectifs
Le traitement des fausses nouvelles soulève d’autres questions lorsque l’on
tient compte des liens (informationnels, thématiques, linguistiques) entre
ces dernières, ou au sein des médias et des réseaux sociaux. Certaines
reprennent des fausses nouvelles déjà connues, les complètent ou les
modifient. Il est aussi intéressant d’étudier les mécanismes de leur
propagation sur des réseaux (statiques) ou sur les relations temporelles
(dynamiques).
Sous-tâches
- regrouper les fausses nouvelles de manière non-supervisée ou peu
supervisée,
- déterminer la structure d’un réseau de fausses nouvelles, pour identifier
des liens orientés selon l’axe temporel et l’axe thématique,
- détecter des communautés (sites ou individus) qui propagent des fausses
nouvelles.
Prix Qwant
Qwant soutient l’événement et apporte un prix à une équipe, selon des
critères liées à l’originalité et l’adéquation de la solution proposée. Le
prix sera attribué selon un vote des participants et organisateurs, le
mardi soir.
Planning prévisionnel
Lundi 14 mai :
- 13h-14h : accueil et café
- 14h-15h : présentation du hackathon
- 15h-18h : développements en équipes
- 18h-19h : présentations invitées
- 19h-20h : cocktail dinatoire
- 20h-... : développements en équipes
Mardi 15 mai :
- 09h-12h : accueil, café, développements en équipes
- 12h-14h : déjeuner et café
- 14h-17h : développements en équipes
- 17h-19h : présentation des résultats
- 19h-21h : conclusion et cocktail
Organisation pratique
BYOD (amenez votre ordinateur)
Pas de critères pour participer, le hackathon est ouvert à tous !
Aucune préparation requise des participants en amont de l’évènement
Logiciels et données en ligne :
https://github.com/HackaTAL/2018
Organisateurs
Antoine Bichet (Storyzy)
Kevin Deturck (Viseo / ERTIM)
Nicolas Dugué (LIUM)
Loïc Grobol (LaTTiCe)
Gael Guibon (LSIS, Caléa)
Charles Huyghues-Despointes (Bertin)
Damien Nouvel (ERTIM)
Benjamin Piwowarski (LIP6)
Ramon Ruti (Storyzy)
Christophe Servan (Qwant)
Raphaël Troncy (Eurecom)
Julien Velcin (ERIC)
--
Loïc Grobol.