Approche bayésienne non paramétrique pour la factorisation de matrice binaire à faible rang avec loi de puissance
TODESCHINI, Adrien
Institut de Mathématiques de Bordeaux [IMB]
Quality control and dynamic reliability [CQFD]
Institut de Mathématiques de Bordeaux [IMB]
Quality control and dynamic reliability [CQFD]
TODESCHINI, Adrien
Institut de Mathématiques de Bordeaux [IMB]
Quality control and dynamic reliability [CQFD]
< Réduire
Institut de Mathématiques de Bordeaux [IMB]
Quality control and dynamic reliability [CQFD]
Langue
fr
Communication dans un congrès
Ce document a été publié dans
47èmes Journées de Statistique de la SFdS, 2015-06-01, Lille. 2015-06
Résumé
Nous proposons un modèle bayésien non paramétrique (BNP) à faible rang pour les graphes bipartis. Récemment, Caron (2012) a proposé un modèle BNP où chaque élément possède son propre paramètre de sociabilité permettant de ...Lire la suite >
Nous proposons un modèle bayésien non paramétrique (BNP) à faible rang pour les graphes bipartis. Récemment, Caron (2012) a proposé un modèle BNP où chaque élément possède son propre paramètre de sociabilité permettant de capturer le comportement en loi de puissance observé dans les graphes bipartis réels. Ce modèle peut être considéré comme une factorisation non négative de rang un de la matrice d'adjacence. En nous appuyant sur les mesures composées aléatoires récemment introduites par Griffin et Leisen (2014), nous dérivons une généralisation de rang p de ce modèle où chaque élément est à présent associé à un vecteur p-dimensionnel de paramètres de sociabilité représentant plusieurs dimensions latentes. Tout en préservant les propriétés désirées d'interprétabilité, de passage à l'échelle et de comportement en loi de puissance, notre modèle est plus flexible et offre de meilleures performances prédictives comme illustré sur plusieurs jeux de données.< Réduire
Résumé en anglais
We introduce a low-rank Bayesian nonparametric (BNP) model for bipartite graphs. Recently, Caron (2012) proposed a BNP model where each node is given its own sociability parameter allowing to capture the power-law behavior ...Lire la suite >
We introduce a low-rank Bayesian nonparametric (BNP) model for bipartite graphs. Recently, Caron (2012) proposed a BNP model where each node is given its own sociability parameter allowing to capture the power-law behavior of real world bipartite graphs. This model can be considered as a rank one nonnegative factorization of the adjacency matrix. Building on the compound random measures recently introduced by Griffin and Leisen (2014), we derive a rank p generalization of this model where each node is associated with a p-dimensional vector of sociability parameters accounting for several latent dimensions. While preserving the desired properties of interpretability, scalability and power-law behavior, our model is more flexible and provides better predictive performance as illustrated on several datasets.< Réduire
Mots clés
méthodes bayésiennes non paramétriques
factorisation de rang faible
MCMC
matrices binaires
graphes bipartis
filtrage collaboratif
Mots clés en anglais
Bayesian nonparametrics
low-rank factorization
binary matrices
bipartite graphs
collaborative filtering
Project ANR
Méthodes bayésiennes non paramétriques pour le traitement du signal et de l'image - ANR-13-BS03-0006
Origine
Importé de halUnités de recherche