Annuler

Ingénieur Développeur BIG DATA H/F

CDD
59000 Lille
CHU DE LILLE

Description du poste

CDD de 3 ans renouvelable

Contexte

Les nouvelles technologies spécialisées dans le traitement intensif des données apparues ces dernières années, combinant Big data et Intelligence artificielle, offrent désormais la possibilité d’exploiter et d’analyser à grande échelle les masses importantes d’informations médicales disponibles dans les hôpitaux.

C’est dans ce contexte, que le CHU de Lille a créé l’équipe INCLUDE dédiée à « l’’exploitation de ses données massives en santé », dont les principales activités se déclinent au travers de :

  • L’exploitation d’une solution d’entrepôt de données de santé en cours d’acquisition
  • Le déploiement de technologies Big Data au service de projets innovants
  • L’utilisation de l’intelligence artificielle pour répondre à des problématiques ciblées en recherche clinique

Profil recherché

Nous recherchons un ingénieur-développeur Big Data passionné par ces technologies et leurs nombreuses utilisations, en mesure de les déployer et de les maintenir

 

Vos missions :

 En rejoignant l’équipe INCLUDE, vous travaillerez au développement des besoins métiers et vous vous verrez confier deux missions principales :

  • La gestion de l’entrepôt de données massives en santé (EDS)
    • Alimenter l’entrepôt de données à partir d’outils d’extraction/intégration de type ETL, reprise initiale
    • Participer aux tests d’intégration et de validation des données
    • Créer, maintenir et documenter les chaines de traitement de données
    • Assurer le niveau de performance des traitements de données (batch ou temps réel) et leur intégrité
    • Assurer l’exploitation, la supervision et le maintien en condition opérationnelle des services de l’EDS
    • Assurer le support et l’assistance de proximité aux utilisateurs de l’EDS
    • participer au déploiement de la solution EDS conjointement avec l'éditeur
  • Le déploiement et l’exploitation d’une infrastructure Big Dat
    • Etude des besoins et élaboration des spécifications techniques de solutions Big Data
    • Définition et conception de l’architecture Big Data, mise en place du cluster
    • Mise en œuvre de solutions et composants Big Data, industrialisation et maintenance
    • Surveiller et exploiter le cluster Big Data pour en assurer une utilisation optimal
    • Rédaction/mise à jour de la documentation techniqu
    • Contribution à l’étude et aux tests de nouveaux produits à intégrer aux service
    • Support technique aux Data Scientist à travers l’implémentation d’algorithme
    • Développer et industrialiser les traitements de données massives pour une transposition aisée à d’autres projet
    • proposer de nouvelles architectures Data adaptées aux besoins des différents projets
    • Assurer la veille technologique dans votre domaine d’expertise afin de proposer de nouvelles idées, expérimentation/évaluation des nouvelles technologies, preuve de concept

 Au quotidien, le candidat aidera les Data Scientist à implémenter de façon distribuée leurs algorithmes de traitement des données et de Machine Learning. Concrètement, il industrialisera ce qu’ils auront réalisés, en utilisant les composants Big Data pour distribuer les calculs sur le cluster.

Profil recherché

Votre profil

De formation Bac+5 en informatique, diplômé d’une école d’ingénieur, d’un master universitaire spécialisé en technologies de l’information ou d’un master Data Science,

  • vous êtes à la recherche d’un nouveau challenge orienté vers la santé
  • vous êtes passionné par les technologies Big Data et disposez d’une première expérience réussie dans ce domaine
  • vous avez déjà utilisé les outils et langages associés à ces technologies
  • Vous possédez de solides compétences sous Linux, java et êtes familier avec les technologies Hadoop, Hive
  • Vous possédez des connaissances en programmation R et/ou Python
  • Vous travaillez avec des bases de données SQL et NoSQL
  • vous êtes curieux et force de proposition

Vos compétences techniques

 

Connaissance approfondie de Linux

 

  • Base de données : SQL et NoSQL, Expérience des ETL
  • programmation Python, Java
  • Expérience significative des composants Big Data et Indexeurs (ElasticSearch, SolR)
  • Expérience dans la mise en oeuvre de solutions Hadoop et de traitements de données (MapReduce, Hive, Spark)
  • Des notions en calcul parallèle et développement d’API seront un plus

 Vos compétences :

  • Vous êtes doté d’un bon relationnel et êtes force de proposition
  • Vous disposez d’une bonne dose de curiosité et d’une fibre analytique et d’un esprit de synthèse
  • Vous avez le sens du service client
  • Vous savez être autonome et prendre des initiatives, notamment dans la recherche de solutions
  • Vous êtes capable de travailler en équipe et de vous adapter

 Interactions et Rattachement :

Rattaché à la Direction des Ressources Numériques et du Système d’Information, vous intégrerez à temps plein l’équipe projet INCLUDE pour participer à des projets innovants dans le domaine du Big Data et de l’exploitation des données massives en santé.

Vous travaillerez en étroite collaboration avec les responsables médicaux du projet, le chef de projet Intégration, le Data Scientist, et d’autres corps de métiers du Centre Hospitalier Universitaire de Lille

Ingénieur Développeur BIG DATA H/F
CDD
59000 Lille