Présentation

Objectifs de la formation

La formation proposée par ce Diplôme Universitaire permet à des professionnels et à des étudiants (niveau Bac+4) d’acquérir des connaissances et des compétences dans les domaines des Data Sciences (informatique, analyse statistique, traitement de données, fouille de données …) afin d’appréhender les problématiques du traitement de (grandes) quantités de données aujourd’hui.

Les compétences globales proposées par cette formation sont les suivantes : maîtriser des concepts statistiques avancés, utiliser des techniques modernes de calcul et de traitement des données, pratiquer des méthodes d’analyse prédictive et d’optimisation, implémenter des algorithmes d’apprentissage supervisé et non supervisé. L’ensemble de ces compétences est mis en œuvre dans les champs disciplinaires des chercheurs et enseignants-chercheurs qui portent cette formation.

Organisation de la formation

La formation dure un an et repose sur 7 Unités d'Enseignement (UE) complémentaires:

  • UE 1: Informatique avancée: 25h
  • UE 2: Statistiques avancées: 20h
  • UE 3: Machine Learning: 20h
  • UE 4: Fouille de données et Big data: 25h
  • UE 5: Architecture, data et computing: 34h
  • UE 6: Outils statistiques (logiciel R): 20h
  • UE 7: Séries temporelles: 20h

Le diplôme universitaire est délivré si au moins 5 UE (choisies parmi les 7) sont validées.  Les UE forment un ensemble auto-cohérent et peuvent aussi être proposées séparément à la Formation Continue.

La formation a lieu à l'UCA, campus des Cézeaux, Aubière, sauf pour L’UE 5 « Architecture, Data et Computing » qui se déroule au Centre de Calcul du CNRS, à Villeurbanne, pendant 5 jours consécutifs.

Les enseignements sont dispensés par des enseignants-chercheurs et des chercheurs du Laboratoire de Physique de Clermont (LPC), du Laboratoire d’Informatique, de Modélisation et d’Optimisation des Systèmes (LIMOS) et du Laboratoire de Mathématiques (LMBP). La formation s'appuie directement sur les recherches conduites dans ces trois laboratoires, en particulier elle bénéficie de l’implication de plusieurs de ses intervenants dans des expériences scientifiques internationales devant gérer et analyser de grandes masses de données telles que le grand collisionneur de hadrons LHC au CERN ou le télescope LSST au Chili.

Les + de la formation

Le Centre de Calcul du CNRS/IN2P3, à Villeurbanne, est un partenaire sur lequel s’adosse la formation. Il propose une expertise et un savoir-faire technologique, en particulier dans le domaine du calcul intensif sur grille informatique (grid computing). Une UE « Architecture, Data et Computing » a été conçue en partenariat avec les ingénieurs du Centre de Calcul et se déroule dans les locaux du centre.

Un expert en Machine Learning travaillant pour l’entreprise Yandex (Russie) intervient dans une des UE de la formation.

Competences et connaissances

Compétences acquises pendant la formation:

  • Maîtriser des concepts statistiques avancés
  • Pratiquer des outils d’analyse de données
  • Programmer avec le logiciel R
  • Concevoir des programmes concurrents
  • Programmer à l’aide du langage Go
  • Programmer en orienté objet
  • Programmer en Python
  • Appliquer des méthodes d’analyse prédictive
  • Construire des modèles statistiques
  • Appliquer des méthodes de classification et de régression
  • Implémenter des algorithmes d’apprentissage supervisé
  • Utiliser des techniques de fouille de données
  • Comprendre les problématiques liées au calcul et à l’architecture
  • Savoir choisir le stockage le plus adapté (cloud, bases de données SQL et NoSQL)
  • Utiliser un Notebook de type Jupyter pour mener une analyse de données

Stage

Le DU ne comporte pas de stage obligatoire. Néanmoins des opportunités de stages peuvent exister dans les organismes partenaires. Cette possibilité pourra être proposée au public de la formation, selon les stages disponibles et au cas par cas.

Programme

Programme en cours de validation

Admission

Conditions

L’admission, pour la Formation Initiale (FI) et Continue (FC), repose sur un dossier de candidature : CV, lettre de motivation, relevé de notes des années précédentes pour la FI, descriptif des compétences en informatique et mathématiques pour la FC. Des entretiens individuels pourront également être mis en place si nécessaire.

Pour la FI un niveau Bac+4 dans un cursus scientifique est requis.

Pré-requis

Des connaissances de base en informatique, programmation et mathématiques (notions de statistiques) sont requises pour profiter des enseignements avancés proposés. Les enseignements sont donnés en anglais et un bonne maîtrise de la langue anglaise est requise (niveau B2).

Date de debut de la formation

10 septembre 2018

Droits de scolarité

Autre

Montant

Tarification Formation Continue: 5200 € pour l'ensemble de la formation, tarification par UE: entre 450 € et 1700 €.

Et après ?

Les métiers visés

Le Diplôme Universitaire offre des débouchés variés dans plusieurs secteurs, tels que :

  • Métiers de Data Scientist (data analyst, data miner)
  • Chargé d’études statistiques
  • Chargé d’études prospectives et d’optimisation
  • Analyste en intelligence socio-économique
  • Responsable gestion et analyse de données
  • Développeur analyste-programmeur
  • Métiers de la Recherche

Contacts

Responsable(s)

DONINI Julien

Email : Julien.DONINI @ uca.fr

Contact(s) administratif(s)

FOURNIER Sophie

Tél : +33473407005

Email : Sophie.FOURNIER @ uca.fr

 

Contact Formation Continue: Sophie FOURNIER, +33 4 73 40 70 05, Sophie.FOURNIER@uca.fr

 

Contact Formation Initiale: Dominique BRUGIERE, +33 4 73 40 70 04, Dominique.BRUGIERE@uca.fr