Modelling the topology of ecological bipartite networks with statistical models for heterogeneous random graphs
Language
en
Thèses de doctorat
This item was published in
p. 139 p.
Doctoral school
Frontières du vivantAbstract
Un réseau écologique constitue une représentation de l’ensemble des interactions entre espèces dans un contexte donné. L’analyse de la structure topologique de ces réseaux permet aux écologues d’identifier et de comprendre ...Read more >
Un réseau écologique constitue une représentation de l’ensemble des interactions entre espèces dans un contexte donné. L’analyse de la structure topologique de ces réseaux permet aux écologues d’identifier et de comprendre les processus sous-jacents. La détection de sous-groupes d’espèces interagissant fortement ensemble, souvent nommés communautés ou compartiments, est un des principaux moyens pour interpréter la structure sous-jacente des réseaux. La méthode de détection de communauté la plus utilisée dans les réseaux écologiques est la méthode de maximisation de la modularité. Toutefois, cette popularité semble plus fondée sur des raisons historiques, et en particulier le premier article publié sur ce thème dans ce contexte, que d’un choix rationnel avec de solides justifications. Il existe de nombreuses autres méthodes de détection de communauté, et de manière plus générale de classification non supervisée, qui peuvent être utilisées pour analyser des réseaux écologiques. L’analyse des réseaux est actuellement un sujet de recherche en pleine expansion avec des applications dans des domaines de recherches variés comme la génomique, les sciences sociales, l’informatique, ou la physique. À notre connaissance, il n’existe pas de comparaison des méthodes de classification non supervisée dans le cas des réseaux écologique. Nous avons effectué une revue des méthodes disponibles de classification non supervisées des nœuds d’un réseau, et nous avons comparé une partie de ces méthodes dans un contexte écologique. Nous avons montré que la méthode de maximisation de la modularité produit des résultats satisfaisants pour détecter les sous-groupes d’espèces dans des réseaux bipartites, mais que cette méthode donne rarement les meilleurs résultats dans l’ensemble des méthodes comparés. Nos résultats montrent que l’algorithme edge-betweennes avec le critère de modularité pour sélectionner le nombre de groupes donne les meilleurs résultats dans le cas des réseaux d’interaction bipartite binaire. Dans le cas des réseaux valués, l’inférence du stochastic block model donne de très bons résultats, mais au prix d’un temps de calcul important. Afin d’évaluer la contribution relative des différents processus pouvant expliquent la structure d’un réseau d’interaction, nous avons introduit de l’information extérieure au réseau (covariables) dans les méthodes de classification non supervisée ; par exemple, nous avons utilisé l’effort d’échantillonnage et la fréquence de rencontre entre espèces afin d’expliquer la structure du réseau d’interaction. Après avoir développé un programme en C++ d’inférence du stochastic block model avec des covariables, nous avons analysé deux réseaux d’interaction arbre–champignon et arbre–insecte. Ces résultats sont préliminaires, mais l’application de la méthode semble ouvrir des perspectives intéressantes dans l’étude des réseaux écologiques. De manière parallèle, nous avons également cherché des communautés dans un réseau écologique de nature différente, un réseau de reproduction entre arbres collecté sur deux espèces ayant la capacité de s’hybrider entre elles. Nous avons utilisé ces résultats pour discuter d’un concept central en écologie, le concept d’espèce.Read less <
English Abstract
An ecological network is a representation of the whole set of interactions between species in a given context. Ecological scientists analyse the topological structure of such networks, in order to understand the underlying ...Read more >
An ecological network is a representation of the whole set of interactions between species in a given context. Ecological scientists analyse the topological structure of such networks, in order to understand the underlying processes. The identification of sub-groups of highly-interacting species (usually called communities, or compartments) is an important stream of research. The most popular method for the search of communities in ecological networks is the modularity optimization method. However this popularity is more due to the first paper published on this topic than to a rational choice based on solid grounds. There are many other clustering methods that could be used to delimit communities in ecological networks. The analysis of complex networks is indeed a rapidly growing topic with many applications in several scientific fields, such as genomics, social, computer and physical sciences. To our knowledge, no comparison of different clustering methods is available in the case of ecological networks. Here we reviewed the whole set of methods available for clustering networks and we compared them using an ecological benchmark. We showed that modularity maximization is a satisfactorily method for clustering species in ecological bipartite networks, but it is not the best. Our results showed that the edge-betweenness algorithm with modularity criterion for selecting group number is a good method for retrieving sub-groups of highly interacting species in binary bipartite networks. The stochastic block model gave very good results in the case of weighted bipartite networks, but it was very time consuming. In order to assess the relative contribution of several processes to the network structure, we integrated exogenous information in the clustering model. For instance, we integrated the sampling effort and some ecological mechanisms such as the encounter probability between species. After having developped a C++ package based on the stochastic block model with covariates, we analysed two bipartite antagonistic networks with this method, a tree-fungus and tree-insect network. The results are still preliminary but the method seems to us very promising for future ecological studies. Finally we searched communities in a different kind of network, a mating network between individuals belonging to two hybridizing tree species. We used our results to discuss a concept which is central in ecology, the species concept.Read less <
Keywords
these
English Keywords
these
Origin
Hal imported