Base graphe

Intégration données d'Arabidopsis thaliana en base graphe

Intégration de données en base graphe

Base graphe neoTE

Une base de données orientée graphe a été construite au sein de l’URGI sur 2 espèces modèles de plante : une monocotylédone (Brachypodium distachyon) et une dicotylédone (Arabidopsis thaliana). Elle intègre de nombreuses données hétérogènes: annotations de génome (annotations structurale et fonctionnelles de gènes, éléments transposables (ET), séquences non codantes conservées (CNS), site de fixation de facteur de transcription (TFBS), relations d’homologie et d’orthologie. De nombreuses études montrent que les éléments transposables (ET) sont cooptés dans des séquences cis-régulatrices. Les ET peuvent donc affecter la transcription des gènes adjacents en recrutant des facteurs de transcription supplémentaires par exemple. Certaines famille d’ET qui portent des TFBS sont notamment connus pour être activée en réponse à certains stress abiotique comme ONSEN/ATCOPIA78 qui est activée par un stress thermique chez Arabidopsis thaliana. La base graphe permet d’identifier quelles sont les familles d’ET spécifiquement liées à des TFBS. Une analyse approfondie sur ces familles d’ET et leurs relations avec les gènes et réseaux de gènes impliqués dans des traits d’adaptation permettra d’améliorer la prédiction de leur impact fonctionnel chez leur hôte. Ce travail s’intéresse aux questions d’exploitation et d’interrogation des relations existantes entre les données par le biais de l’outil base de données orientées graphe. Il permet de développer des questions complexes faisant interagir plusieurs sources de données.

https://hal.science/hal-04208925 

Les nœuds et les relations

NEO4J_NODE_LIST
NEO4J_RELATION_LIST

 

Exemple de visualisation des données

 

NEO4J_EXEMPLE

Date de modification : 10 octobre 2023 | Date de création : 15 juillet 2021 | Rédaction : NF