Implementació d’un programa de clusterització de proteïnes basat en la similitud de seqüència i aplicat en la caracterització dels receptors CD300
Autor/a
Altres autors/es
Data de publicació
2019-06Resum
L’augment exponencial de dades obtingudes en biologia molecular degut a la implementació de tècniques d’alt rendiment ha impulsat la necessitat de desenvolupar mètodes que permetin el tractament i organització d’aquestes. Les biomolècules més abundants en l’organisme són les proteïnes i, degut a l’interès que desperten, s’obté d’elles una gran quantitat d’informació que ha esdevingut en un desenvolupament d’eines que en permeten l’anàlisi i el tractament. Un tipus de tractament consisteix en l’agrupament per similitud de seqüència, el qual ens permet associar potencials característiques a una proteïna de la qual només se’n coneix la seqüència, mitjançant la similitud amb altres biomolècules d’aquest grup ja conegudes. Aquesta associació es basa en el fet que seqüències similars semblen esdevenir en estructures semblants, les quals determinen la funció de la proteïna.
L’objectiu d’aquest treball és implementar una eina informàtica que permeti agrupar les proteïnes en base a aquesta similitud per tal de generar Xarxes de Similitud de Seqüència. Per crear-la, s’ha utilitzat el llenguatge de programació Python per generar un script que pren com a input inicial un conjunt de seqüències i genera un fitxer que permet visualitzar-se, usant el software Cytoscape, com una xarxa basada en un llindar de similitud que adjudica l’usuari. S’ha fet una prova inicial per estudiar el funcionament d’aquesta eina amb la família de receptors CD300, un conjunt molècules interessants pel Laboratori de Bioquímica i Biofísica Computacional (CBBL), on s’ha dut a terme aquest treball.
Com ha resultat s’ha obtingut una eina informàtica que permet treballar amb un nombre elevat de seqüències suposant un baix cost computacional gràcies a que treballa amb alineaments per parelles i que, aplicada a la família CD300 dona resultats molt similars als obtinguts mitjançat arbres filogènics. L’avantatge que presenta és que, al tractar-se d’un script generat de novo, permet futures implementacions de metadata, gràcies a les qual també es podrien classificar les molècules segons la seva funció, entre d’altres.
Tipus de document
Projecte/Treball fi de carrera o de grau
Llengua
Català
Paraules clau
Anàlisi de conglomerats
CD300
Pàgines
44 p.
Nota
Curs 2018-2019
Aquest element apareix en la col·lecció o col·leccions següent(s)
- Grau en Biotecnologia [139]
Drets
Tots els drets reservats