15
Novembre 2011
Journée thématique
organisée par le GDR ISIS Thème A
La journée commencera à 10h,
pour se terminer à 17h.
Programme
: (voir ci-dessous)
Lieu
: Amphi B 310,
Telecom ParisTech, 46 rue Barrault Paris
13ème
Organisatrice : Gersende Fort
(email :
gersende.fort.at.telecom-paristech.fr
Méthodes de
Monte Carlo
pour les
problèmes inverses bayésiens
en
traitement des signaux et des images
|
Thème
:
Les méthodes de Monte Carlo sont des algorithmes de simulation
de nuages de points pour l'approximation de lois de probabilité
à valeur dans un espace X général.Elles sont
notamment utilisées pour l'exploration de lois complexes, la
complexité résultant par exemple de la structure de
l'espace X, de sa dimension ou de l'expression de la loi cible.
Dans la résolution des problèmes inverses
bayésiens, l'apprentissage des quantités
d'intérêt se traduit par l'exploration de la loi a
posteriori de ces quantités.Du fait de la complexité de
la modélisation statistique, l'exploration de ces lois a
posteriori est résolue par des techniques de simulation
appelées méthodes de Monte
Carlo.
Cette journée sera plus particulièrement
consacrée aux nouvelles méthodologies pour les
méthodes de Monte Carlo par Chaînes de Markov (MCMC) et
leurs applications à la résolution de problèmes
inverses bayésiens en traitement des signaux et des images.
Elle comprendra 4 ou 5 exposés invités de 40 min
dont
- Inférence
bayésienne pour les modèles dynamiques linéaires
avec des processus de Dirichlet à mélange -
François Caron (INRIA Bordeaux)
- Algorithme MCMC pour le démélange spectral -
Nicolas
Dobigeon (IRIT)
- Déconvolution de trains d'impulsion : au-delà de
l'échantillonneur de Gibbs - Jérôme Idier (IRCCyN)
- Using parallel computation to improve Independent
Metropolis-Hastings
based estimation - Christian Robert (CEREMADE)
ainsi que des
présentations de 20 à 30 min relatives aux nouvelles
méthodologies MCMC et
leurs applications à la résolution de problèmes
inverses bayésiens en traitement des signaux et des images.
Appel
à contribution : Les propositions d'exposés courts
(20 à 30 min) sont à envoyer à l'organisatrice avant le 21 Octobre 2011. Elles
contiendront le titre de l'exposé, l'auteur, un
résumé d'une dizaine de lignes et
éventuellement, la référence de la publication
associée.
Programme :
l'heure de
début et celle de fin de la journée sont fixées.
Eventuellement, l'ordre des talks pourra être modifié
selon les contraintes des orateurs.
10h - 10h40
|
Jérôme Idier (IRCCyN)
Déconvolution
de trains d'impulsion : au-delà de l'échantillonneur de
Gibbs
|
10h45- 11h25
|
François Caron (INRIA
Bordeaux)
Inférence
bayésienne pour les modèles dynamiques linéaires
avec des processus de Dirichlet à mélange |
11h30 -11h50
|
Pascal Szacherski (IMS / CEA Leti)
Reconstruction
de
profils protéiques |
11h55 -12h15
|
Thierry Montagu (CEA)
Inférence bayésienne non paramétrique
pour la reconstruction d’images 3D en TEP
|
|
|
13h30 -14h10
|
Nicolas Dobigeon (IRIT)
Algorithme
MCMC pour le démélange spectral
|
14h15 -14h35
|
Rémi Perenon (CEA-Leti)
Méthodes MCMC
dédiées à la spectrométrie de masse
à base de NEMS |
14h40- 15h
|
Stéphanie Allassonnière
(CMAP)
Anisotropic
Metropolis
Adjusted Langevin Algorithm: convergence and utility in
Stochastic EM algorithm for image analysis. |
15h05-15h25
|
Asma Rabaoui (IMS)
A New Markov Chain Monte Carlo Based
Estimation Under Equality Constraints
|
|
|
15h40 -16h20
|
Christian Robert (CEREMADE)
Using
parallel computation to improve Independent Metropolis-Hastings based
estimation
|
16h25 -16h45
|
Pierre Jacob (CREST)
Wang-Landau
algorithm
and some improvements for density exploration
|
16h50 - 17h
|
Mathieu Bredif (IGN, MATIS)
librjmcmc, une librairie générique C++ open-source
d'optimisation stochastique
|
Titre et Résumé des
exposés confirmés :
Orateur : François Caron
(INRIA Bordeaux)
Titre : Inférence
bayésienne
pour les modèles dynamiques linéaires
avec des processus de Dirichlet à mélange
Résumé :
En utilisant les algorithmes de Kalman, il est possible d'effectuer
l'estimation optimale dans les modèles dynamiques
linéaires à bruits additifs gaussiens. On
considère ici le cas où les distributions des bruits sont
non gaussiennes et de forme fonctionnelle inconnue. Un modèle
bayésien non paramétrique flexible, basé sur les
processus de Dirichlet à mélange de gaussiennes est
introduit. Des méthodes MCMC efficaces sont alors
développées dans ce contexte. Je présenterai une
illustration en déconvolution aveugle de signaux.
Référence
: F. Caron, M. Davy, A. Doucet, E. Duflos, P.
Vanheeghe. Bayesian Inference for Linear Dynamic Models with Dirichlet
Process Mixtures. IEEE Transactions on Signal Processing. Vol. 56(1),
pp. 71-84, 2008.
Orateur : Nicolas Dobigeon (IRIT)
Titre : Algorithme
MCMC
pour le démélange spectral
Résumé :
Le démélange spectral est une étape importante
dans l'analyse physico-chimique par spectroscopie (infrarouge, Raman,
EELS,...) ou le traitement des images hyperspectrales (de
télédétection, astronomiques,...). Il consiste
à décomposer les données mesurées en un
ensemble de spectres élémentaires et à quantifier
leurs proportions respectives dans chaque mélange
observé. Suivant le contexte de l'étude
(supervisé, semi-supervisé ou non-supervisé), le
démélange spectral est souvent formulé comme un
problème inverse ou de séparation aveugle de sources.
Nous présenterons dans cet exposé des stratégies
d'estimation bayésienne permettant de résoudre le
problème de démélange tout en assurant la prise en
compte des contraintes physiques inhérentes aux modèles
d'observation. Nous détaillerons les algorithmes de
démélange résultants basés sur des
méthodes de Monte Carlo par chaînes de Markov. Quelques
exemples de résultats issus de plusieurs applications seront
proposés.
Orateur : Jérôme
Idier (IRCCyN)
Titre : Déconvolution
de
trains d'impulsion : au-delà de l'échantillonneur de
Gibbs
Résumé :
La déconvolution de trains d'impulsions est un problème
d'intérêt pour de nombreuses applications
(géophysique, spectrométrie, contrôle non
destructif, etc). L'approche MCMC est un choix naturel pour traiter ce
problème sous sa forme aveugle, non supervisée et hors
ligne. La déconvolution de trains d'impulsions a pu ainsi
apparaître comme un exemple idéal d'application de
méthodes MCMC standard de type Gibbs dès les
années 1990. Or plusieurs difficultés sous-jacentes
empêchent le succès de telles méthodes. Cet
exposé mettra en évidence ces difficultés et des
solutions pratiques pour les résoudre. L'accent sera finalement
mis sur des considérations de portée plus
générale, intéressant de nombreuses applications
potentielles des MCMC à la restauration de signaux et d'images.
Orateur : Christian Robert
(CEREMADE)
Titre : Using
parallel computation to improve Independent Metropolis-Hastings based
estimation
Résumé :
In this paper, we consider the implications of the fact that
parallel raw-power can be exploited by a generic Metropolis-Hastings
algorithm if the proposed values are independent. In particular, we
present improvements to the independent Metropolis{ Hastings algorithm
that signi cantly decrease the variance of any estimator derived from
the MCMC output, for a null computing cost since those improvements are
based on a xed number of target density evaluations. Furthermore, the
techniques developed in this paper do not jeopardize the Markovian
convergence properties of the algorithm, since they are based on the
Rao{Blackwell principles of Gelfand and Smith (1990), already exploited
in Casella and Robert (1996), Atchade and Perron (2005) and Douc and
Robert (2010). We illustrate those improvement both on a toy normal
example and on a classical probit regression model but insist on the
fact that they are universally applicable.
Référence :
Joint work with P. Jacob and M. Smith, arXiv:1010.1595
Orateur : Stéphanie
Allassonnière (CMAP)
Titre : Anisotropic
Metropolis
Adjusted Langevin Algorithm: convergence and utility in
Stochastic EM algorithm for image analysis.
Résumé : Sampling
a
random variable in a high dimensional framework becomes a crucial
issue regarding the large range of applications that require such
samples, such that image analysis. The Langevin simulation MCMC method
- a Langevin simulation within a Metropolis Hastings acceptation
procedure- is well adapted in this context. However, the isotropic
covariance matrix usually prevents from a numerical convergence which
suffers from the low acceptation rate. In this work, we propose to
adapt the Langevin simulation taking into account the anisotropy of the
problem. We prove that this new algorithm leads to a geometrically
ergodic Markov chain.
Moreover, we apply this new MCMC method into a stochastic EM algorithm
in order to estimate some model parameter by maximizing the likelihood.
We prove that under mild conditions, the estimated parameters converge
almost surely with a Normal behaviour of the limit. All this pipeline
is numerically tested on handwritten digits and some medical images.
Orateur : Mathieu Bredif
(MATIS)
Titre : librjmcmc,
une
librairie générique C++ open-source d'optimisation stochastique.
Résumé : La librairie librjmcmc est
une librairie C++ open-source développée au laboratoire MATIS de
l'Institut Géographique National suite aux travaux en optimisation
stochastique menés en collaboration avec l'équipe ARIANA de
l'INRIA. Cette librairie a été conçue pour
être à la
fois extrêmement modulaire et pour avoir des performances comparables en temps de
calcul à un code développé spécifiquement, grâce au paradigme de
programmation générique. L'optimisation stochastique proposée
repose sur un recuit simulé couplé à un échantillonneur
RJ-MCMC. La modularité de la librairie permet de traiter indifféremment
tout type de donnée en entrée (eg des signaux1D, des
images 2D, des nuages de points 3D...), pourvu que l'utilisateur de la librairie
fournisse les modules décrivant une configuration, les noyaux de
saut réversible, l'évaluation des énergies à
minimiser et l'espace de recherche probabilisé (processus de référence).
La librairie comporte des modules plus spécifiques de type processus ponctuels
marqués, permettant par exemple d'optimiser un critère MAP avec
une attache aux données image sur un processus ponctuel marqué de
rectangles [Tournaire 2010].
Référence: O.
Tournaire, M. Brédif, D. Boldo, M. Durupt, An efficient stochastic approach
for building footprint extraction from digital elevation models,
ISPRS Journal of Photogrammetry and Remote Sensing, Volume 65, Issue 4,
July 2010, Pages 317-327, ISSN 0924-2716, http://dx.doi.org/10.1016/j.isprsjprs.2010.02.002
Orateur : Mame
Diarra
Fall (MAP5)
Titre : Inférence
bayésienne non paramétrique pour la reconstruction
d’images 3D en TEP
Résumé : Dans
cet exposé, nous traitons le problème de la
reconstruction spatiale tridimensionnelle en tomographie par
émission de positons (TEP). L’objectif est de reconstruire la
distribution spatiale d’activité directement à partir des
données mesurées, sans discrétisation
préalable. Pour cela, nous avons abordé le
problème de reconstruction sous la forme d’un problème
indirect d’estimation de densité dans un cadre bayésien
non paramétrique. La modélisation bayésienne
permet de régulariser le problème inverse mal
posé, l’approche non paramétrique fournit un cadre
robuste et flexible pour l’estimation. L’une des difficultés
dans cette approche est de traiter le nombre infini de composantes
pendant l’inférence et ce, sans tronquer le modèle. Nous
avons développé un schéma d’échantillonnage
efficace basé sur les méthodes MCMC. L’estimateur
proposé a été comparé avec celui du maximum
a posteriori et on présente des résultats sur
données simulées à partir d’un fantôme
cérébral.
Références :
M.D. Fall, É. Barat, C. Comtat, T. Dautremer, T. Montagu and A.
Mohammad-Djafari A discrete-continuous Bayesian Model for Emission
Tomography. Proceedings of the 18th IEEE International Conference on
Image Processing, ICIP 2011, Brussels, Belgium (2011).
Orateur : Pierre Jacob (CREST)
Titre : Wang-Landau
algorithm and some improvements for density exploration
Résumé : The
proposed
exploration
algorithm combines and expands upon components from various
adaptive Markov chain Monte Carlo methods, with the Wang-Landau
algorithm at
its heart. We first introduce the algorithm and then advocate its use
for a preliminary Monte Carlo "exploration" of the posterior density.
This additional step in the statistical analysis is particularly useful
for multimodal, high-dimensional posterior distributions, given the
algorithm's ability to escape from local modes. Additionally it allows
to design efficient proposal distributions for any subsequent MCMC
method. Among other examples, the authors demonstrate the
ability of the algorithm to overcome the high correlations encountered
in
spatial models through a 2D Ising model.
Orateur : Rémi
Perenon (CEA-Leti)
Titre : Méthodes MCMC
dédiées à la spectrométrie de masse
à base de NEMS
Résumé :
Le spectromètre de masse est un outil puissant pour analyser la
répartition en masse de molécules dans une solution. Les
spectromètres de masse actuels fonctionnent en mode flux, sur
des valeurs moyennes associées à un ensemble de
molécules. Nous étudions une technologie
émergente, reposant sur des systèmes
électromécaniques nanométriques (NEMS). Ces
capteurs fonctionnent en mode comptage, sur des mesures
élémentaires associées à chaque
molécule. En effet, en bombardant les molécules sur le
capteur NEMS et en suivant sa fréquence de résonance, on
obtient une courbe « en escalier » où chaque instant
de chute de fréquence de résonance correspond à
l’adsorption d’une molécule unique et chaque amplitude à
sa masse. Afin de retrouver le spectre de masse de ces
molécules, nous introduisons un modèle direct reliant cet
ensemble de molécules au signal issu de l’adsorption
séquentielle de chacune des molécules. Nous formulons
l’estimation du spectre de masse comme la résolution d’un
problème inverse dans le cadre général des
processus ponctuels marqués. Nous proposons une méthode
basée sur l’échantillonneur de Gibbs et nous
étudions en particulier l’échantillonnage discret des
instants d’adsorption.
L’exposé présentera le contexte instrumental de la
spectrométrie de masse à base de NEMS puis l’algorithme
d’inversion proposé à base de méthodes MCMC. Nous
mettrons notamment l’accent sur la résolution du problème
d’échantillonnage discret puis nous discuterons des performances
de cet algorithme.
Référence : R.
Pérenon, A. Mohammad-Djafari, L. Duraffourg, P. Grangeat
Quantification moléculaire par spectrométrie de masse
à base de NEMS : modélisation et inversion du
problème. 23ème Colloque GRETSI sur le Traitement du
Signal et des Images, 2011.
Orateur : Asma Rabaoui (IMS)
Titre : A New
Markov Chain Monte Carlo Based Estimation Under Equality Constraints
Résumé :
In this talk, we propose a new algorithm to estimate a set of variables
that are indirectly observed, with the difficulty that they have to
satisfy equality constraints. Classically, such estimates are computed
by minimizing a penalized criterion. However, deterministic
gradient-based techniques for instance may turn out to be inefficient
if the cost function to be minimized is non convex, due to nonlinear
constraints or observation functions and/or non Gaussian noises. As an
alternative, we propose an original Bayesian approach formulation of
the estimation problem wherein the constraints are used to define prior
distributions of the unknown variables. Then, we design an original
Markov Chain Monte Carlo (MCMC) technique to solve it. On major
contribution consists in introducing a warming-type schedule within the
MCMC iterations which allows us to generate candidate solutions that
gradually enforce the constraints. Furthermore, an importance sampling
procedure is applied to guarantee the homogeneity of the Markov chain
thus simulated by using the so-called Sequential Monte Carlo (SMC)
samplers. The resulting algorithm consists in interacting parallel MCMC
steps that converge to the posterior distribution of interest. The
proposed approach is evaluated by simulating a realistic scenario of a
multi-sensor estimation problem.
Joint work with A. Giremus (IMS).
Orateur : Pascal
Szacherski (IMS / CEA Leti)
Titre : Reconstruction de profils protéiques
Résumé : Dans cette
contribution, nous proposons d’étudier un problème du
domaine de la protéomique. Nous cherchons à reconstruire
des profils protéiques à partir de données issues
d’un tandem associant chromatographie liquide et spectrométrie
de masse. Or, les signaux cibles sont des mesures de traces peptidiques
qui sont de faible niveau dans un environnement
très complexe et perturbé. Ces perturbations peuvent
provenir des instruments de mesure (variabilité
technique) ou des individus (variabilité biologique). Le
modèle hiérarchique de l’acquisition des
données permet d’inclure ces variabilités explicitement
dans la modélisation (probabiliste) directe. La mise
en place d’une méthodologie problèmes inverses permet
ensuite d’estimer les grandeurs d’intérêt. Pour cela, nous
pouvons exprimer un problème inverse pour
– la quantification d’une ou plusieurs
protéines cibles,
– l’apprentissage des paramètres des
classes à partir d’une cohorte biclasse, et
– la classification d’un nouvel
échantillon à partir des connaissances sur les classes.
Dans cette contribution, nous étudions la question du
diagnostic d’un échantillon c’est-à-dire de la
classification-inversion (en deux classes). Elle
s’incrit dans le projet ANR BHI-PRO qui se propose d’étudier
l’apport des approches bayésiennes de l’inversion
hiérarchique et des algorithmes de MCMC sur la gestion et la
maîtrise des variabilités.
Références : P.
Szacherski, J.-F. Giovannelli, and P. Grangeat. Joint Bayesian
Hierarchical Inversion-Classification and Application in Proteomics. In
2011 IEEE Workshop Statistical Signal Processing, Nice, France, June
2011.IEEE.
P. Szacherski, J.-F. Giovannelli, L. Gerfault, and P. Grangeat.
Apprentissage supervisé robuste de caractéristiques de
classes. application en protéomique. In XXIIIème Colloque
GRETSI, Bordeaux, France, September 2011. GRETSI.
P. Grangeat, P. Szacherski, L. Gerfault, and J.-F. Giovannelli.
Bayesian hierarchical reconstruction of protein profiles including a
digestion model. In 59th ASMS Conference, Dallas, USA, June 2011.