Vous êtes ici :

Ingénieur d’études en traitement des données - CDD 12 mois

Date de publication : 17/09/24

ThèmesRecrutement Recrutement - Autres postes à pourvoir 

Affectation : Centre d’études internationales de la propriété intellectuelle (CEIPI)

Emploi ouvert aux agents contractuels uniquement

CDD 12 mois (renouvelable) à compter du 01/11/24

 

Catégorie : A         Corps : Ingénieur d’études

Rémunération selon grille de la Fonction Publique

 

Contexte :

Ce poste entre dans le développement du CEIPI dans un contexte de transformation numérique de la composante répondant aux enjeux de la digitalisation de ses activités.

 

Ce poste s’inscrit en particulier dans le développement des activités prévues dans le cadre de la chaire « Dynamique des normes en Europe face aux technologies émergentes » (DENoTE) portée par le CEIPI.

 

Mission :

L’agent interviendra dans le domaine de l’ingénierie informatique en assurant la conception et le développement d‘outils de traitement automatique du langage et d’analyse de données appliqués aux données juridiques, notamment textuelles, à l’analyse du lien entre science, technologies et normes et aux applications des modèles au service de la description des processus créatif.

 

  • Activités principales :

1. Développement d’outils d’analyse textuelle de données juridiques et scientifique :

Le/la titulaire du poste sera responsable de la conception et de la mise en place d'une méthode innovante de représentation des brevets et des articles académiques, optimisée pour le suivi des changements et de l’évolution des thématiques dans divers domaines scientifiques et technologiques. Cette représentation devra intégrer l’information temporelle et les contributions techniques majeures des documents tout en restant invariante face aux styles de rédaction.

Développer une méthode de représentation des documents : concevoir et développer une méthode de représentation combinant l’information temporelle et les contributions techniques principales des brevets et articles académiques.

Générer une vue globale de l’évolution des concepts : utiliser la nouvelle méthode de représentation des documents pour créer une vue d’ensemble de l’évolution des concepts clés dans des domaines spécifiques.

Détection de l’émergence de nouveaux concepts : mettre en place des méthodes de détection des nouveaux concepts en mesurant les différences entre les nouveaux clusters de concepts et ceux déjà existants, afin d’évaluer la nouveauté et l’importance des nouveaux concepts dans un domaine.

 

2. Développement d’outils de représentation des données de style :

Le/la titulaire du poste sera responsable de la conception et du développement d’outils d’analyse de la notion de style artistique.

Représentation des styles : développer des techniques basées sur des embeddings pour représenter et analyser l'évolution des "styles artistiques" à partir de données textuelles (critiques, descriptions, théories artistiques) ou d’images d'œuvres d'artistes.

Modélisation de l’évolution stylistique : Identifier et modéliser les caractéristiques stylistiques des œuvres et auteurs pour créer une représentation évolutive de l'évolution des styles artistiques.

Visualisation : Utiliser les embeddings pour visualiser les similarités et les différences entre les styles, et suivre l’émergence et la transformation des styles artistiques au fil du temps.

 

3. Développement d'un système de RAG (Retrieval-Augmented Generation) dédié à l’exploitation de textes juridiques :

Le/la titulaire du poste étudiera la faisabilité et proposera des solutions pour le développement d’outils de représentation et d’indexation de documents textuels juridiques (jurisprudences, textes, règlementaires, codes, etc.).

Représentation vectorielle des documents : élaborer une méthode de représentation spécifique aux textes juridiques, prenant en compte les particularités du langage juridique, les structures des documents (ex. articles de lois, jugements, contrats) et les relations entre les différentes parties de texte.

Mise en œuvre d’une base de donnée vectorielle : Concevoir une architecture de base de données vectorielle optimisée pour le stockage et la récupération efficace de textes juridiques représentés par des embeddings, permettant une recherche sémantique avancée et une analyse comparative.

Interface : Développer une interface utilisateur interactive permettant d’exploiter ces textes juridiques, incluant des fonctionnalités de recherche, d’analyse et de visualisation des relations et de l’évolution des concepts juridiques, en prenant en charge la mise à jour dynamique des données et l’intégration des nouvelles sources de textes juridiques.

 

Contact(s) pour renseignements sur le poste :

M. THOMAS Stéphane - Responsable administratif du CEIPI :  stephane.thomas@ceipi.edu

 

Pour candidater, veuillez adresser CV et lettre de motivation avant le 15/10/24 par courriel uniquement, à : stephane.thomas@ceipi.edu

Partenaires

Logo du CNRS
Logo Établissement associé de l'Université de Strasbourg
Logo du réseau Epicur
Logo de EUCOR, Le Campus européen
Logo de l'Inserm Grand Est
Logo de l'Inria

Labels

Logo du label Bienvenue en France
Logo du programme HRS4R
Logo du programme France 2030
Logo de Service Public+

Réseaux

Logo de France Universités
Logo de la Ligue européenne des universités de recherche (LERU)
Logo du réseau Udice
Logo de l'Université franco-allemande