Présentation de l'atelier

Le nombre d’articles scientifiques produits chaque année ne cesse d'augmenter. Rien que dans l’archive ouverte arXiv, le nombre d’articles scientifiques déposés en 2022 s’élève à plus de 185.000, soit près de 500 dépôts chaque jour. Face à cette explosion du volume de littérature scientifique, des solutions intelligentes sont nécessaires pour faciliter la recherche et la lecture des articles scientifiques et pour en analyser le contenu et y extraire des informations utiles aux chercheurs et aux applications qui les utilisent (e.g Semantic Scholar). De plus, l’avènement de la science ouverte et la disponibilité croissante des textes intégraux soulèvent de nouveaux enjeux pour le traitement automatisé des articles scientifiques et interroge sur l’utilisabilité des modèles de langues actuels. Comment analyser et rendre accessible les informations contenues dans les tables, les équations ou les figures sont autant de questions qui doivent être explorées.

L’atelier sur l’Analyse et la Recherche de Textes Scientifiques (ARTS) se veut un lieu de rencontre et d’échange pour les chercheurs en Recherche d’Information (RI) et en Traitement Automatique des Langues (TAL) qui s’intéressent aux textes scientifiques. Nous sollicitons des communications pouvant porter sur les thèmes, incluant, de façon non limitative :

  • Recherche et recommandation d’articles scientifiques
  • Extraction d’information dans les textes scientifiques, tableaux, figures, bibliographie
  • Analyse de documents scientifiques
  • Reconnaissance d'entités nommées dans les textes scientifiques
  • Résumé automatique de textes scientifiques
  • Analyse et recommandation de citations
  • Détection de plagiat
  • Détection et vérification d'affirmations scientifiques
  • Analyse argumentative de textes scientifiques
  • Visualisation des connaissances scientifiques
  • Traduction de textes scientifiques
  • Jeux de données composés des textes scientifiques
  • Bibliométrie, scientométrie

Programme

9h00 Ouverture de l'atelier
9h15 Conférencier invité
10h00 Pause café
10h30 Session "booster" présentations
11h45 Cloture de l'atelier et installation des posters
12h00 Session "poster" et pause déjeuner
  

Venir à l'atelier

L'atelier ARTS aura lieu dans le bâtiment Esclangon dans les locaux du SCAI (Sorbonne Center for Artificial Intelligence).

Pour accéder au bâtiment Esclangon, il faut entrer par l'entrée avant du campus, 4 place Jussieu (à côté du métro Jussieu). Le plan suivant donne Le chemin vers le bâtiment Esclangon depuis l'entrée place Jussieu :

Capture_d_e_cran_2023_06_01_a_13.38.15.png

Conférence invitée

Mathieu Constant (ATILF, Université de Lorraine)

Construction d’un jeu de données de publications scientifiques pour le TAL et la fouille de textes à partir d’ISTEX

La plateforme ISTEX (https://www.istex.fr/) permet d’accéder à une large base d’archives scientifiques comptant plus de 25 millions de documents de tous les grands domaines scientifiques. Les documents incluent non seulement les métadonnées mais aussi le texte plein, et ont été prétraités de manière homogène pour faciliter leur traitement automatique. Dans cet exposé, nous présenterons une initiative pour créer une dynamique de recherche en TAL et TDM autour de ces données. En particulier, nous présenterons les travaux en cours pour la construction d’un jeu de données dédié au TAL et la fouille de textes.

Articles acceptés

Actes de l'atelier

Les actes de l'atelier sont disponible au téléchargement sur ce lien. Ils seront, dans un second temps, déposés sur HAL, TALN Archives et ACL Anthology.

Dates importantes

Date limite de soumission : 31 mars 2023
Notification aux auteurs : 21 avril 2023
Versions définitives : 5 mai 2023
Atelier : 5 juin 2023

Soumission des articles

Les articles seront rédigés en français pour les francophones, en anglais pour ceux qui ne maîtrisent pas le français. Ils devront suivre le format mini de CORIA-TALN 2023 (4 pages + références).

Feuille de style : https://coria-taln-2023.sciencesconf.org/page/feuilles_de_style

Comité scientifique

  • Sabine Barreaux (INIST, CNRS)
  • Guillaume Cabanac (IRIT, Université Toulouse 3)
  • Florian Boudin (LS2N, Nantes Université)
  • Mathieu Constant (ATILF, Université de Lorraine)
  • Béatrice Daille (LS2N, Nantes Université)
  • Richard Dufour (LS2N, Nantes Université)
  • Natalia Grabar (STL, Université de Lille)
  • Thierry Hamon (LISN, Université Sorbonne Paris Nord)
  • Evelyne Jacquey (ATILF, CNRS)
  • Cyril Labbé (LIG, Université Grenoble Alpes)
  • François Yvon (LISN, CNRS)

Comité d'organisation

  • Florian Boudin (LS2N, Nantes Université)
  • Béatrice Daille (LS2N, Nantes Université)
  • Richard Dufour (LS2N, Nantes Université)
  • Oumaima El Khettari (LS2N, Nantes Université)
  • Maël Houbre (LS2N, Nantes Université)
  • Léane Jourdan (LS2N, Nantes Université)
  • Nihel Kooli (DGA)
Personnes connectées : 2 Vie privée
Chargement...