|
|
Présentation de l'atelier Le nombre d’articles scientifiques produits chaque année ne cesse d'augmenter. Rien que dans l’archive ouverte arXiv, le nombre d’articles scientifiques déposés en 2022 s’élève à plus de 185.000, soit près de 500 dépôts chaque jour. Face à cette explosion du volume de littérature scientifique, des solutions intelligentes sont nécessaires pour faciliter la recherche et la lecture des articles scientifiques et pour en analyser le contenu et y extraire des informations utiles aux chercheurs et aux applications qui les utilisent (e.g Semantic Scholar). De plus, l’avènement de la science ouverte et la disponibilité croissante des textes intégraux soulèvent de nouveaux enjeux pour le traitement automatisé des articles scientifiques et interroge sur l’utilisabilité des modèles de langues actuels. Comment analyser et rendre accessible les informations contenues dans les tables, les équations ou les figures sont autant de questions qui doivent être explorées.
Programme
Venir à l'atelier L'atelier ARTS aura lieu dans le bâtiment Esclangon dans les locaux du SCAI (Sorbonne Center for Artificial Intelligence). Pour accéder au bâtiment Esclangon, il faut entrer par l'entrée avant du campus, 4 place Jussieu (à côté du métro Jussieu). Le plan suivant donne Le chemin vers le bâtiment Esclangon depuis l'entrée place Jussieu : Conférence invitée Mathieu Constant (ATILF, Université de Lorraine) Construction d’un jeu de données de publications scientifiques pour le TAL et la fouille de textes à partir d’ISTEX La plateforme ISTEX (https://www.istex.fr/) permet d’accéder à une large base d’archives scientifiques comptant plus de 25 millions de documents de tous les grands domaines scientifiques. Les documents incluent non seulement les métadonnées mais aussi le texte plein, et ont été prétraités de manière homogène pour faciliter leur traitement automatique. Dans cet exposé, nous présenterons une initiative pour créer une dynamique de recherche en TAL et TDM autour de ces données. En particulier, nous présenterons les travaux en cours pour la construction d’un jeu de données dédié au TAL et la fouille de textes. Articles acceptés
Actes de l'atelier Les actes de l'atelier sont disponible au téléchargement sur ce lien. Ils seront, dans un second temps, déposés sur HAL, TALN Archives et ACL Anthology. Dates importantes Date limite de soumission : 31 mars 2023 Soumission des articles Les articles seront rédigés en français pour les francophones, en anglais pour ceux qui ne maîtrisent pas le français. Ils devront suivre le format mini de CORIA-TALN 2023 (4 pages + références). Comité scientifique
Comité d'organisation
|
Personnes connectées : 2 | Vie privée |