Lille 3 > Faculté des Humanités > Département Sciences du Langage > Les formations > Masters Sciences du langage > Lexicographie, terminographie, traitement automatique des corpus

Master "Sciences du langage" parcours "Lexicographie, Terminographie, Traitement Automatique des Corpus"

Actualités

Guide des études 2017-2018 (M1 et M2)

Vous retrouverez le guide des études 2017-2018 ici.

Le parcours « Lexicographie, Terminographie et Traitement Automatique des Corpus » (LTTAC) de la mention Sciences de langage de master vise à donner une qualification en ingénierie linguistique en phase avec les nouvelles technologies de l’information et de la communication.
Cette qualification permet une insertion professionnelle dans différents domaines :

  • rédaction d’encyclopédies et de dictionnaires monolingues, bilingues ou plurilingues ;
  • conception de bases de données pour la lexicographie et la terminologie ;
  • développement de lexiques pour des outils d’aide à la rédaction ou des systèmes de traduction automatique ou assistée ;
  • élaboration de catalogues et de guides thématiques ;
  • construction d’ontologies pour le traitement automatique des langues et l’intelligence artificielle ;
  • intégration de ressources lexicales à des moteurs de recherche et autres outils d’extraction d’informations ;
  • etc.

Au terme de leur formation, les diplômés de la formation peuvent prétendre à une insertion professionnelle en tant que, notamment, lexicographes (rédacteurs ou chefs de projets) ; terminologues dans le domaine public ou privé ; traducteurs-terminologues dans des entreprises de traduction de logiciels ; informaticiens dans des équipes d’informatique éditoriale ; linguistes-informaticiens dans des entreprises relevant des industries de la langue ; rédacteurs de guides pratiques et de catalogues techniques ou commerciaux.

Consultez les fiches ROME (Répertoire Opérationnel des Métiers et des Emplois) correspondant à une partie des emplois cités ci-dessus :

  • E1105 : Coordination d’édition (Assistant / Assistante d’édition ; Directeur / Directrice éditoriale ; Éditeur / Éditrice ; Responsable d’édition) ; 
  • E1108 : Traduction, interprétariat (Traducteur / Traductrice terminologue) ; 
  • E1205 : Réalisation de contenus multimédias (Infographiste ; Web designer / designeuse) ;
  • E1305 : Préparation et correction en édition et presse (Correcteur-éditeur / Correctrice-éditrice de textes ; Correcteur / Correctrice d’édition ; Correcteur / Correctrice ; Préparateur-correcteur / Préparatrice-correctrice) ;
  • E1306 : Prépresse (Rédacteur / Rédactrice en chef ; Opérateur / Opératrice en Publication Assistée par Ordinateur – PAO – ; Claviste en Publication Assistée par Ordinateur – PAO – ; Opérateur / Opératrice de prépresse) ;  
  • K2401 : Recherches en Sciences de l’homme et de la société (Lexicographe ; Terminologue ; Lexicologue ; Linguiste ; Chargé / Chargée de recherches en sciences humaines).

    Pour un aperçu des emplois effectivement occupés par les diplômés du master LTTAC, merci de vous reporter au répertoire d’emplois réalisé par l’Observatoire des Formations et de la Vie Étudiante (OFIVE) de Lille 3 après enquête auprès des diplômés du master en cliquant ici (requête : « Sciences du langage » puis « Lexicographie, Terminographie, Traitement Automatique des Corpus).
    Vous pouvez également consulter la liste des partenaires professionnels tuteurs de stages ou recruteurs de diplômés de master LTTAC.

Le parcours LTTAC est conçu pour présenter un processus de description lexicale complet, tout en fournissant des compétences fondamentales pour se spécialiser dans l’un des types d’activité que ce processus intègre :

  • tout commence par la documentation des usages des locuteurs, ce qui implique de savoir sélectionner et collecter des observables afin de constituer des corpus, souvent de structurer ces derniers informatiquement, en XML, et de les enrichir d’annotations, et, enfin, de les explorer ;
  • il convient ensuite de savoir analyser les emplois lexicaux observés en mobilisant les connaissances linguistiques pertinentes ;
  • il est en outre nécessaire de savoir définir un principe de description, que ce soit pour un projet éditorial, une documentation lexicale interne à une entreprise ou une ressource destinée à des outils logiciels, puis d’être en mesure d’élaborer les descriptions des items sélectionnés en fonction de ce principe, en usant des codifications pertinentes, de modalités rédactionnelles adaptées, etc. ;
  • enfin, les descriptions dictionnairiques rédigées sont (originellement ou par manipulation des textes saisis) des documents structurés en XML, comme le sont aujourd’hui la majorité des contenus éditoriaux publiés, et leur présentation à des lecteurs implique un processus d’informatique éditoriale et de composition pour la mise en forme et les publications sous forme de livres imprimés ou numériques (ePub, pdf, etc.) ou d’applications, ou comme contenus de sites Web.

Compétences linguistiques générales

  • Disposer d’un solide bagage théorique en linguistique fondamentale.
  • Manier correctement l’anglais scientifique, à l’oral et à l’écrit (en réception et en production).

Connaissances scientifiques et professionnelles spécifiques au parcours LTTAC

  • Être capable de réinvestir les connaissances linguistiques acquises pour la production de divers types de descriptions lexicales.
  • Savoir élaborer et exploiter un corpus électronique destiné à des analyses linguistiques, en particulier pour la documentation de descriptions lexicales.
  • Être initié aux différentes composantes de l’activité lexicographique et terminographique.
  • Avoir une bonne connaissance des dictionnaires imprimés et électroniques récents, et des produits antérieurs les plus importants.
  • Avoir une représentation des évolutions du secteur éditorial de la référence et, plus largement, de l’édition avec l’avènement d’outils informatiques de production et de lecture.
  • Avoir une solide compétence en manipulations éditoriales de flux XML (de documents textuels structurés en XML) pour l’édition d’ouvrages imprimés ou électroniques, d’applications ou de sites Web.
  • Être informé  des domaines d’application du traitement automatique des langues et des industries développant des outils informatiques à composante lexicale.
  • Être familiarisé avec les réalités de la vie professionnelle.

Maîtrise d’outils et de ressources

  • Savoir manier les ressources et outils informatiques pertinents pour l’ensemble des applications concernées par les analyses linguistiques, dont le traitement du lexique et les traitements lexicographiques et terminographiques.
  • Maîtriser le langage de structuration de documents XML (corpus documentaires ou contenus éditoriaux) ainsi que ceux qui permettent de décrire les modèles de documents (DTD, schémas) et de procéder à des manipulations structurelles et textuelles (en XSLT, en particulier).
  • Programmer en JavaScript et en Perl pour l’extraction d’informations au sein de documents textuels (informatiquement structurés ou non).
  • Avoir de solides bases en :
    ••manipulation de logiciels de transcription alignée aux sons ou aux vidéos et de systèmes d’alignement de corpus multilingues,
    ••manipulation d’outils d’indexation automatique de documents et d’étiqueteurs morphosyntaxiques,
    ••manipulation de concordanciers et d’outils de fouille de textes et d’extraction d’informations,
    ••conception d’ontologies,
    ••conception de bases de données SQL et emploi de celles-ci pour le stockage de données linguistiques comme pour l’élaboration de dictionnaires en ligne,
    ••manipulation d’outils de publication assistée par ordinateur (PAO), comme InDesign, pour l’édition imprimée, électronique ou multisupports de divers types de produits éditoriaux.

    Savoir-faire

    • Savoir sélectionner des ressources documentaires répondant efficacement à un besoin d’analyse linguistique.
    • Savoir définir un projet de descriptions lexicales en fonction des besoins des destinataires humains ou logiciels, sélectionner les informations à fournir et en déterminer les modalités d’expression (rédigée ou codifiée selon la destination).
    • Savoir rédiger des descriptions lexicales destinées à des lecteurs humains ou dédiées à des applications informatiques.
    • Être capable de mener à terme une réflexion sur un objet de recherche en lien avec la formation (analyse critique de dictionnaires publiés, réflexion méthodologique pour la conception d’outils informatiques pour la linguistique, etc.) ou de développer un projet original (de corpus documentaire, de dictionnaire, d’encyclopédie, de logiciel à composante lexicale, etc.) susceptible de déboucher sur une application concrète.

La formation est ouverte aux étudiants francophones de toutes nationalités. La pratique de plusieurs langues – langues de large diffusion ou d'extension plus restreinte – est un atout particulièrement apprécié dans l'ensemble des activités professionnelles qui ont recours aux techniques du traitement automatique des langues.
En formation initiale, le parcours LTTAC s’inscrit de manière naturelle dans la filiation de cursus comportant une composante linguistique et/ou de traitement automatique des langues. Il est toutefois également accessible aux étudiants venant d’autres filières en fonction de leur projet professionnel.
En reprise d'études, le parcours est en particulier ouvert :

  • aux professionnels des industries de la langue impliqués dans la constitution et la manipulation de ressources lexicales structurées et de corpus
  • aux professionnels de la lexicographie et de la terminographie souhaitant compléter leur formation théorique
  • aux spécialistes de disciplines scientifiques et techniques désireux de s’initier à la méthodologie d’élaboration de répertoires disciplinaires
  • aux éditeurs soucieux d'actualiser leurs connaissances en gestion de flux éditoriaux XML
  • aux professionnels des industries de la langue impliqués dans la constitution et la manipulation de ressources lexicales structurées et de corpus qui cherchent à parfaire leurs connaissances en traitements automatiques.

MASTER 1

Calendrier de candidature 2017-2018

  • Début des candidatures : 30 avril 2017
  • Clôture des candidatures : 30 mai 2017
  • Publication de l'admission : 30 juin 2017
Mentions de licence conseillées
  • Mention Sciences du langage
  • Mention Lettres
  • Mention Informatique
  • Mention LLCER
  • Mention Histoire
  • Mention Philosophie

Critères d'examen des candidatures

La stabilité des résultats au fil du temps et d'une UE à l'autre sera appréciée.

Modalités d'examen des candidatures
  • Dossier détaillé du cursus suivi par le candidat permettant notamment d'apprécier les objectifs et les compétences visées par la formation antérieure
  • Relevés de notes, diplômes, certificats permettant d'apprécier la nature et le niveau des études suivies
  • Lettre de motivation exposant le projet professionnel et/ou de recherche
  • Curriculum vitae détaillé
  • Attestation spécifique à la nature des enseignements suivis antérieurement en lien avec la formation visée

Composition du dossier

  • CV synthétique + lettre de motivation faisant état de la formation antérieure du ou de la candidat.e et de sa cohérence avec le parcours LTTAC
  • Projet de recherche ou professionnel rédigé (outre le contenu informationnel, ce sont les qualités rédactionnelles et orthographiques de ces documents qui seront appréciées)
  • C2i ou autre attestation de connaissances en informatique
  • Relevés de notes des formations universitaires suivies

Pour déposer votre candidature, merci de vous reporter ici. (attention : les candidatures ne peuvent pas être déposées avant l'ouverture de la campagne de recrutement).

MASTER 2

Calendrier

Première campagne :

  • Début des candidatures : 30 avril 2017
  • Clôture des candidatures : 30 mai 2017
  • Publication de l'admission : 30 juin 2017

En fonction des places disponibles à l'issue de la première campagne, une seconde campagne pourra avoir lieu selon le calendrier suivant :

  • Début des candidatures : 15 juillet 2017
  • Clôture des candidatures : 30 août 2017
  • Publication de l'admission : 10 septembre 2017

Conditions
Étudiant-e-s en formation initiale
Vous devez être titulaire d'une première année de master ou équivalent (bac+4) de sciences du langage, de lettres, de langues (LLCE ou LEA), d'informatique appliquée ou de philosophie.
Les candidat.e.s titulaires d'une autre première année de master ou équivalent ayant un projet professionnel motivé pourront se voir proposer un programme de lectures ou d’enseignements complémentaire.

Les candidat-e-s en reprise d'études peuvent ne pas satisfaire aux conditions de diplôme énoncées ci-dessus. Si leur candidature reçoit une réponse favorable, ils devront ensuite remplir une demande de validation d'acquis simplifiée (envoyée par le secrétariat des sciences du langage).

Dossier de candidature au M2 :

Merci de téléchargez le dossier de candidature en cliquant ici (les candidat-e-s ayant suivi le M1 LTTAC rempliront la version simplifiée ici).

Guide des études 2017-2018: ici

Le M1 et le M2 comportent respectivement 420 et 430 heures de cours, auxquelles s’ajoutent un stage de 3 mois minimum par année assorti d’un rapport de stage et d’une soutenance, et la rédaction d’un mémoire de recherche en M1, de recherche ou de projet professionnel en M2. Les enseignements s’échelonnent de septembre à mars en M2 et mai en M1. Les étudiants qui exercent une activité professionnelle pourront bénéficier d’un régime aménagé leur permettant d’étaler chaque année de formation au-delà d’une année universitaire.

MASTER 1 - 60 crédits européens 

  • Linguistique. Théories linguistiques (Morphologie – Grammaires de construction) – Initiation à des outils logiciels (Annotations morphosyntaxiques). 6 ECTS
  • Lexicographie & terminographie. Lexicographie bilingue et linguistique contrastive 1 – Analyses structurelles de dictionnaires 1 – Analyse de l’offre dictionnairique 1 – Rédaction d’articles selon un projet éditorial 1. 12 ECTS
  • Traitement Automatique des Corpus (TAC) & Traitement Automatique des Langues (TAL). Ressources et outils informatiques pour la linguistique – Algorithmique – Programmation pour l’extraction d’informations (JavaScript) 1 et 2 – Activités du TAL. 12 ECTS
  • Informatique éditoriale (gestion de flux XML). Xmlisation de documents bruts ou stylés – XSLT pour l’édition en HTML. 6 ECTS
  • Professionnalisation. Gestion de projets lexicographiques, éditoriaux ou talistes 1 – Méthodologie : préparation aux stages – Stage. 6 ECTS
  • Initiation à la recherche. Mémoire. 6 ECTS
  • Langue vivante. Anglais (ou Français Langue Étrangère pour les étudiants de l’international le désirant). 6 ECTS
  • Spécialisation. Au choix : Linguistique, Littérature, Édition, Traduction, Informatique, Seconde langue vivante. 6 ECTS

 MASTER 2 - 60 crédits européens

  • Linguistique. Théories linguistiques (Syntaxe) – Sémantique. 6 ECTS
  • Lexicographie & terminographie. Lexicographie bilingue et linguistique contrastive 2 – Analyses structurelles de dictionnaires 2 – Analyse de l’offre dictionnairique 2 – Rédaction d’articles selon un projet éditorial 2 – Lexicographie électronique 1 (bases XML et XSLT) et 2 (bases SQL et PHP). 18 ECTS
  • Traitement Automatique des Corpus (TAC) & Traitement Automatique des Langues (TAL). Bases de données et corpus– Programmation pour l’extraction d’informations (Perl) 1 et 2– Programmation pour l’enrichissement de corpus. 12 ECTS
  • Informatique éditoriale (gestion de flux XML). Enrichissements xmlisés de textes – Connaissance de la chaîne éditoriale électronique – Éditions multisupports (PDF, InDesign et ePub) de textes xmlisés – Éthique des éditions électroniques ou bimédia. 6 ECTS
  • Professionnalisation. Gestion de projets lexicographiques, éditoriaux ou talistes 2 – Stage. 6 ECTS
  • Initiation à la recherche. Mémoire de recherche ou deprojet professionnel– Initiation à la recherche dans le monde académique et dans le secteur privé. 6 ECTS
  • Langue vivante. Anglais (ou Français Langue Étrangère pour les étudiants de l’international le désirant) en autoformation – Anglais avancé : academic writing. 6 ECTS

  • Pour des informations relatives à la vie de la formation – conseils de lectures, partenaires professionnels, sujets de stages et de mémoires des anciens étudiants, etc. – cliquez ici //sous peu//
  • Pour des questions précises ou des informations personnalisées :
    ••sur le contenu pédagogique de la formation, merci de contacter la responsable de la formation : Nathalie Gasiglia, maître de conférences habilitée à diriger des recherches, nathalie.gasiglia@univ-lille3.fr, 03.20.41.66.61 ou 06.11.44.20.33,
    ••sur des questions administratives portant sur le master, merci de contacter Anne Martel, secrétaire pédagogique du master, anne.martel@univ-lille3.fr, 03 20 41 61 14.
  • Pour un accompagnement à la reprise d’études, merci de consulter le Service universitaire des validations d’acquis : https://www.univ-lille3.fr/validation-acquis/adultes-reprise-etudes/ ; 03 20 41 66 47.

L'emploi du temps 2016-17 : M1/ M2
En cours d'année universitaire, merci de consulter chaque semaine les emplois du temps affichés au secrétariat du département Sciences du langage ainsi que sur la plateforme Moodle.

 

Dernière mise à jour : samedi 30 septembre 2017 à 20h03