El catálogo 'unknome' contiene casi 2 millones de proteínas. Muchas son misteriosas.
Cuando se trata de fronteras vastas y poco exploradas, la mente se dirige hacia el espacio y los océanos de la Tierra. Pero incluso en el cuerpo humano, aún hay mucho por descubrir. Conozca el "unknome", una nueva base de datos que enfatiza cuánto aún no sabemos sobre los genes y las proteínas humanas.
La base de datos, disponible públicamente, clasifica grupos de proteínas según cuánto se sabe de ellas. Esa información podría ayudar a los científicos a identificar proteínas para estudios futuros, incluyendo el tratamiento de enfermedades y el descubrimiento de medicamentos, informan los investigadores el 8 de agosto en PLOS Biology.
El biólogo celular Sean Munro y sus colegas compilaban el unknome, una combinación de las palabras "unknown" (desconocido) y "genome" (genoma), para identificar proteínas poco estudiadas pero potencialmente importantes y sus genes correspondientes que codifican proteínas: ADN que copia la receta de una proteína en ARN (SN: 2/9/22).
Las proteínas generalmente se agrupan en familias que tienen un ancestro evolutivo común. La base de datos unknome contiene todas las familias de proteínas con al menos una proteína codificada por el libro de instrucciones genéticas humanas, o genoma, o por los genomas de otros 11 organismos comúnmente estudiados. Se incluyen más de 13,000 grupos y casi 2 millones de proteínas.
El unknome asigna una puntuación de "conocimiento" a cada grupo de proteínas en función de cuánto se sabe sobre sus genes correspondientes. Alrededor de 3,000 de esos grupos, incluidos 805 que contienen al menos una proteína humana, tienen una puntuación de conocimiento igual a cero, lo que muestra que aún hay mucho por aprender dentro del genoma humano (SN: 3/31/22).
Munro y sus colegas utilizaron la base de datos para estudiar 260 genes que son compartidos entre moscas de la fruta y humanos y que tienen puntuaciones de conocimiento bajas. Después de disminuir la actividad de cada uno de los genes que codifican proteínas en las moscas, los investigadores encontraron que alrededor de 60 eran esenciales para la vida. Otros eran importantes para la reproducción, el crecimiento, el movimiento y la resistencia contra el estrés.
"Incluso en organismos muy estudiados como las moscas, hay cosas nuevas por descubrir", dice Munro, del Laboratorio de Biología Molecular del Consejo de Investigación Médica en Cambridge, Inglaterra.
Aunque aún se desconoce si algunos o todos esos genes tienen efectos similares en los humanos, la base de datos podría ayudar a los investigadores a identificar proteínas importantes en los humanos al examinar rápidamente proteínas similares en organismos más fáciles de estudiar, como las moscas de la fruta, dice el científico de datos Tudor Oprea de Expert Systems Inc., una empresa de descubrimiento de medicamentos en San Diego, que no estuvo involucrado en el estudio.
Munro dice que el próximo paso para su grupo es colaborar con esfuerzos similares, como la Iniciativa de Proteínas Poco Estudiadas, para realizar un estudio a gran escala de estas proteínas misteriosas.
Nuestra misión es proporcionar noticias precisas y atractivas sobre la ciencia al público. Esa misión nunca ha sido más importante de lo que es hoy.
Como organización de noticias sin fines de lucro, no podemos hacerlo sin su ayuda.
Su apoyo nos permite mantener nuestro contenido gratuito y accesible para las próximas generaciones de científicos e ingenieros. Invierta en un periodismo científico de calidad haciendo una donación hoy.