Analyse des données
Un perturbateur montre le bâtiment 42

Analyse des données

Le professeur Dr. habil. Rouven E. Haschka

Dr Samyajoy Pal

Associé de recherche

Samyajoy Pal est actuellement post-doctorant et collaborateur scientifique à la chaire de Data Analytics de la faculté des sciences économiques de la RPTU Kaiserslautern-Landau.

Il a obtenu son doctorat en statistique au département de statistique de la LMU de Munich. Ses recherches se situent à l'interface de la statistique, de l'apprentissage automatique et de l'intelligence artificielle, avec un accent particulier sur les bases méthodologiques et théoriques de l'apprentissage statistique, de la statistique mathématique et de l'inférence statistique.

Ses recherches se concentrent en particulier sur les modèles mixtes multivariés flexibles et leurs applications dans l'apprentissage statistique automatique, le clustering basé sur des modèles, la classification et la modélisation prédictive. Ses autres domaines de recherche comprennent les modèles linéaires généralisés, l'analyse de données hautement dimensionnelles et compositionnelles, les procédures de régression régularisées ainsi que la modélisation statistique multivariée.

Un objectif central de sa recherche est le développement de méthodes d'apprentissage automatique interprétables et fondées sur des probabilités, qui combinent l'inférence statistique classique avec des approches modernes de l'IA. Dans ce contexte, il s'intéresse à l'Intelligence Artificielle Explicable (XAI), à l'apprentissage automatique interprétable ainsi qu'aux réseaux neuronaux profonds basés sur les Autoencodeurs Variables (VAE) et les modèles de variables latentes basés sur les mélanges. Ses recherches visent à renforcer les bases statistiques de l'IA moderne grâce à des méthodes d'apprentissage théoriquement fondées, interprétables et basées sur l'inférence.

Intérêts pour la recherche

Apprentissage statistique, Inférence statistique, Statistiques mathématiques, Apprentissage automatique interprétable, Intelligence artificielle explicable, Modèles mixtes multivariés, Clustering basé sur des modèles, Analyse de données à haute dimension

Informations complémentaires

  • Pal, S. (2025). Advances in finite mixture models with applications to unsupervised learning. Thèse de doctorat, LMU Munich.

  • Pal, S., & Heumann, C. (2025). Revisiting Dirichlet Mixture Model : unraveling deeper insights and practical applications. Cahiers de statistiques, 66 (1), 2.

  • Pal, S., & Heumann, C. (2024). Flexible Multivariate Mixture Models : A Comprehensive Approach for Modeling Mixtures of Non-Identical Distributions. International Statistical Review.

  • Pal, S., & Heumann, C. (2024). Analyse de la coexpression des gènes avec le modèle de mélange de Dirichlet : accélération de l'évaluation du modèle par approximation de la divergence KL en forme fermée à l'aide de techniques variationnelles. In : International Workshop on Statistical Modelling, 134-141. Springer Nature Suisse.

  • Pal, S., & Heumann, C. (2024). Modèle de mélange gaussien avec algorithme hard EM modifié dans des problèmes de clustering. In : Modélisation statistique et applications aux problèmes en temps réel., 153-179. CRC Press.

  • Pal, S., & Heumann, C. (2022). Clustering compositional data using Dirichlet mixture model. PLOS One, 17 (5), e0268438.