Bonjour à tous,

Je vois passer depuis quelque jour des discussions sur les Fake News, j'en profites pour passer l'info, si certains d'entre vous se trouvent vers Rennes les 14 et 15 mai :)

Fake ou pas Fake ?

Hackathon CORIA-TALN 2018

(hackathon en recherche d’information et traitement automatique des langues)


Résumé


Tâches : détection et visualisation de fausses informations sur les réseaux

Site web : http://hackatal.github.io/2018

Dates : 14 et 15 mai 2018

Lieu : IRISA, Rennes

Inscription (gratuite mais obligatoire) : https://goo.gl/forms/soTeFTikjWol8bj13  !


Description


Dans le cadre de la conférence CORIA-TALN-RJC 2018 est organisé un hackathon, 3ème édition côté CORIA (Hack Days) et TALN (HackaTAL). L’évènement porte sur des problématiques en RI et en TAL. L’objectif est de réunir les communautés scientifiques, et au delà, autour de défis à relever, pour modéliser, prototyper, coder, expérimenter, développer, tester, évaluer, échanger, etc. - par équipes, dans une ambiance décontractée :) !


Les tâches proposées portent cette année sur la détection et le traitement d’informations manifestement fausses, un sujet de préoccupation pour les médias et citoyens. Ces problématiques, nouvelles pour la société de l’information, soulèvent de nombreuses questions et nous essaierons de voir si des traitements RI et TAL peuvent y répondre, pour mieux comprendre les phénomènes en jeu et y réagir, plus rapidement et de manière plus adéquate, à l’aide d’algorithmes du domaine.


Un jeu de données sera fourni par la société Storyzy sur la thématique de la vaccination, qui est un sujet occasionnant la diffusion de nombreuses fausses nouvelles. Il contiendra des textes provenant de divers sites web en anglais et en français, ainsi que des transcriptions automatiques de vidéos sur cette même thématique.


L’événement est ouvert à tous (informaticiens, linguistes, journalistes), ne nécessite aucune préparation particulière et ne requiert pas de compétences spécifiques aux tâches que nous proposons... tout le monde est bienvenu !


Tâches


1. Détection : repérer et catégoriser les fausses informations


Objectifs


Parmi les informations disponibles en ligne certaines sont manifestement fausses et il n’est pas évident de faire la part des choses, autant pour les médias, entreprises ou laboratoires (notamment à cause des volumes de données à traiter), que pour les citoyens : quels indices caractérisent les fausses informations ? L’objectif de cette tâche est de voir si des algorithmes TAL et RI sont capables de détecter et catégoriser finement ces fausses informations.


Sous-tâches


- parmi un ensemble de textes, déterminer automatiquement lesquels sont des faux (contrefactuels, détournés, trompeurs, parodiques),

- catégoriser les fausses informations parmi un ensemble de catégories prédéfinies (sites propagandistes, conspirationnistes, pseudo-science, satires),

- caractériser les faux d’un point de vue linguistique : quels modes d’expression, quelles tournures sont utilisées pour propager de fausses informations.


2. Visualisation : agrégation des fausses nouvelles pour une vision synthétique


Objectifs


Le traitement des fausses nouvelles soulève d’autres questions lorsque l’on tient compte des liens (informationnels, thématiques, linguistiques) entre ces dernières, ou au sein des médias et des réseaux sociaux. Certaines reprennent des fausses nouvelles déjà connues, les complètent ou les modifient. Il est aussi intéressant d’étudier les mécanismes de leur propagation sur des réseaux (statiques) ou sur les relations temporelles (dynamiques).


Sous-tâches


- regrouper les fausses nouvelles de manière non-supervisée ou peu supervisée,

- déterminer la structure d’un réseau de fausses nouvelles, pour identifier des liens orientés selon l’axe temporel et l’axe thématique,

- détecter des communautés (sites ou individus) qui propagent des fausses nouvelles.


Prix Qwant


Qwant soutient l’événement et apporte un prix à une équipe, selon des critères liées à l’originalité et l’adéquation de la solution proposée. Le prix sera attribué selon un vote des participants et organisateurs, le mardi soir.


Planning prévisionnel


Lundi 14 mai :

- 13h-14h : accueil et café

- 14h-15h : présentation du hackathon

- 15h-18h : développements en équipes

- 18h-19h : présentations invitées

- 19h-20h : cocktail dinatoire

- 20h-... : développements en équipes


Mardi 15 mai :

- 09h-12h : accueil, café, développements en équipes

- 12h-14h : déjeuner et café

- 14h-17h : développements en équipes

- 17h-19h : présentation des résultats

- 19h-21h : conclusion et cocktail


Organisation pratique


BYOD (amenez votre ordinateur)

Pas de critères pour participer, le hackathon est ouvert à tous !

Aucune préparation requise des participants en amont de l’évènement

Logiciels et données en ligne : https://github.com/HackaTAL/2018


Organisateurs


Antoine Bichet (Storyzy)

Kevin Deturck (Viseo / ERTIM)

Nicolas Dugué (LIUM)

Loïc Grobol (LaTTiCe)

Gael Guibon (LSIS, Caléa)

Charles Huyghues-Despointes (Bertin)

Damien Nouvel (ERTIM)

Benjamin Piwowarski (LIP6)

Ramon Ruti (Storyzy)

Christophe Servan (Qwant)

Raphaël Troncy (Eurecom)

Julien Velcin (ERIC)


--
Loïc Grobol.