qui me
semble intéressant à porter à votre attention.
Florence
Le 27/04/2018 à 19:38, Loïc Grobol a écrit :
Bonjour à tous,
Je vois passer depuis quelque jour des discussions sur les Fake News,
j'en profites pour passer l'info, si certains d'entre vous se trouvent
vers Rennes les 14 et 15 mai :)
Fake ou pas Fake ?
Hackathon CORIA-TALN 2018
(hackathon en recherche d’information et traitement automatique des
langues)
Résumé
Tâches : détection et visualisation de fausses informations sur les
réseaux
Site web :
http://hackatal.github.io/2018
Dates : 14 et 15 mai 2018
Lieu : IRISA, Rennes
Inscription (gratuite mais obligatoire) :
https://goo.gl/forms/soTeFTikjWol8bj13 !
Description
Dans le cadre de la conférence CORIA-TALN-RJC 2018 est organisé un
hackathon, 3ème édition côté CORIA (Hack Days) et TALN (HackaTAL).
L’évènement porte sur des problématiques en RI et en TAL. L’objectif
est de réunir les communautés scientifiques, et au delà, autour de
défis à relever, pour modéliser, prototyper, coder, expérimenter,
développer, tester, évaluer, échanger, etc. - par équipes, dans une
ambiance décontractée :) !
Les tâches proposées portent cette année sur la détection et le
traitement d’informations manifestement fausses, un sujet de
préoccupation pour les médias et citoyens. Ces problématiques,
nouvelles pour la société de l’information, soulèvent de nombreuses
questions et nous essaierons de voir si des traitements RI et TAL
peuvent y répondre, pour mieux comprendre les phénomènes en jeu et y
réagir, plus rapidement et de manière plus adéquate, à l’aide
d’algorithmes du domaine.
Un jeu de données sera fourni par la société Storyzy sur la thématique
de la vaccination, qui est un sujet occasionnant la diffusion de
nombreuses fausses nouvelles. Il contiendra des textes provenant de
divers sites web en anglais et en français, ainsi que des
transcriptions automatiques de vidéos sur cette même thématique.
L’événement est ouvert à tous (informaticiens, linguistes,
journalistes), ne nécessite aucune préparation particulière et ne
requiert pas de compétences spécifiques aux tâches que nous
proposons... tout le monde est bienvenu !
Tâches
1. Détection : repérer et catégoriser les fausses informations
Objectifs
Parmi les informations disponibles en ligne certaines sont
manifestement fausses et il n’est pas évident de faire la part des
choses, autant pour les médias, entreprises ou laboratoires (notamment
à cause des volumes de données à traiter), que pour les citoyens :
quels indices caractérisent les fausses informations ? L’objectif de
cette tâche est de voir si des algorithmes TAL et RI sont capables de
détecter et catégoriser finement ces fausses informations.
Sous-tâches
- parmi un ensemble de textes, déterminer automatiquement lesquels
sont des faux (contrefactuels, détournés, trompeurs, parodiques),
- catégoriser les fausses informations parmi un ensemble de catégories
prédéfinies (sites propagandistes, conspirationnistes, pseudo-science,
satires),
- caractériser les faux d’un point de vue linguistique : quels modes
d’expression, quelles tournures sont utilisées pour propager de
fausses informations.
2. Visualisation : agrégation des fausses nouvelles pour une vision
synthétique
Objectifs
Le traitement des fausses nouvelles soulève d’autres questions lorsque
l’on tient compte des liens (informationnels, thématiques,
linguistiques) entre ces dernières, ou au sein des médias et des
réseaux sociaux. Certaines reprennent des fausses nouvelles déjà
connues, les complètent ou les modifient. Il est aussi intéressant
d’étudier les mécanismes de leur propagation sur des réseaux
(statiques) ou sur les relations temporelles (dynamiques).
Sous-tâches
- regrouper les fausses nouvelles de manière non-supervisée ou peu
supervisée,
- déterminer la structure d’un réseau de fausses nouvelles, pour
identifier des liens orientés selon l’axe temporel et l’axe thématique,
- détecter des communautés (sites ou individus) qui propagent des
fausses nouvelles.
Prix Qwant
Qwant soutient l’événement et apporte un prix à une équipe, selon des
critères liées à l’originalité et l’adéquation de la solution
proposée. Le prix sera attribué selon un vote des participants et
organisateurs, le mardi soir.
Planning prévisionnel
Lundi 14 mai :
- 13h-14h : accueil et café
- 14h-15h : présentation du hackathon
- 15h-18h : développements en équipes
- 18h-19h : présentations invitées
- 19h-20h : cocktail dinatoire
- 20h-... : développements en équipes
Mardi 15 mai :
- 09h-12h : accueil, café, développements en équipes
- 12h-14h : déjeuner et café
- 14h-17h : développements en équipes
- 17h-19h : présentation des résultats
- 19h-21h : conclusion et cocktail
Organisation pratique
BYOD (amenez votre ordinateur)
Pas de critères pour participer, le hackathon est ouvert à tous !
Aucune préparation requise des participants en amont de l’évènement
Logiciels et données en ligne :
https://github.com/HackaTAL/2018
Organisateurs
Antoine Bichet (Storyzy)
Kevin Deturck (Viseo / ERTIM)
Nicolas Dugué (LIUM)
Loïc Grobol (LaTTiCe)
Gael Guibon (LSIS, Caléa)
Charles Huyghues-Despointes (Bertin)
Damien Nouvel (ERTIM)
Benjamin Piwowarski (LIP6)
Ramon Ruti (Storyzy)
Christophe Servan (Qwant)
Raphaël Troncy (Eurecom)
Julien Velcin (ERIC)
--
Loïc Grobol.
_______________________________________________
Wikimediafr mailing list
Wikimediafr(a)lists.wikimedia.org
https://lists.wikimedia.org/mailman/listinfo/wikimediafr