Les catalogues "unknome" recensent près de 2 millions de protéines. Beaucoup d'entre elles sont mystérieuses.
Quand il s'agit de frontières vastes et peu explorées, l'espace et les océans de la Terre viennent à l'esprit. Mais même dans les corps humains, il y a encore beaucoup à découvrir. Découvrez le "unknome", une nouvelle base de données qui met en évidence tout ce que nous ne savons toujours pas sur les gènes et les protéines humains.
La base de données publiquement disponible classe les groupes de protéines en fonction de ce que l'on sait peu sur eux. Ces informations pourraient aider les scientifiques à identifier des protéines pour des études futures, notamment pour le traitement des maladies et la découverte de médicaments, rapportent les chercheurs le 8 août dans PLOS Biology.
Le biologiste cellulaire Sean Munro et ses collègues ont compilé le unknome - un mot-valise des mots "unknown" (inconnu) et "genome" - pour identifier les protéines peu étudiées mais potentiellement importantes et leurs gènes correspondants : l'ADN qui copie la recette d'une protéine en ARN (SN : 2/9/22).
Les protéines sont généralement regroupées en familles ayant un ancêtre évolutif commun. La base de données unknome contient toutes les familles de protéines comportant au moins une protéine codée par le livre d'instructions génétiques humaines, ou génome, ou par les génomes de 11 autres organismes couramment étudiés. Plus de 13 000 groupes et près de 2 millions de protéines sont inclus.
Le unknome attribue un score de "connaissance" à chaque groupe de protéines en fonction de ce que l'on sait sur leurs gènes correspondants. Environ 3 000 de ces groupes, dont 805 contiennent au moins une protéine humaine, ont un score de connaissance nul, ce qui montre qu'il y a encore beaucoup à apprendre dans le génome humain (SN : 3/31/22).
Munro et ses collègues ont utilisé la base de données pour étudier 260 gènes partagés entre les drosophiles et les humains et ayant des scores de connaissance faibles. Après avoir réduit l'activité de chacun des gènes codant les protéines chez les drosophiles, les chercheurs ont découvert qu'environ 60 étaient essentiels à la vie. D'autres étaient importants pour la reproduction, la croissance, le mouvement et la résistance au stress.
"Même chez des organismes très bien étudiés comme les drosophiles, il y a encore de nouvelles choses à découvrir", dit Munro, du Laboratoire de biologie moléculaire du Conseil de recherche médicale à Cambridge, en Angleterre.
Il est encore inconnu si certains ou tous ces gènes ont des effets similaires chez les humains. Mais la base de données pourrait aider les chercheurs à identifier des protéines humaines importantes en filtrant rapidement des protéines similaires dans des organismes plus faciles à étudier, comme les drosophiles, déclare le scientifique des données Tudor Oprea d'Expert Systems Inc., une société de découverte de médicaments à San Diego, qui n'a pas participé à l'étude.
Munro déclare que la prochaine étape pour son groupe est de collaborer avec des initiatives similaires comme l'Initiative pour l'étude des protéines méconnues pour une étude à grande échelle de ces protéines mystérieuses.
Notre mission est de fournir des informations précises et captivantes sur la science au public. Cette mission n'a jamais été aussi importante qu'aujourd'hui.
En tant qu'organisation de presse à but non lucratif, nous ne pouvons pas le faire sans vous.
Votre soutien nous permet de maintenir notre contenu gratuit et accessible à la prochaine génération de scientifiques et d'ingénieurs. Investissez dans un journalisme scientifique de qualité en faisant un don aujourd'hui.