Implementació d’un programa de clusterització de proteïnes basat en la similitud de seqüència i aplicat en la caracterització dels receptors CD300
Author
Other authors
Publication date
2019-06Abstract
L’augment exponencial de dades obtingudes en biologia molecular degut a la implementació de tècniques d’alt rendiment ha impulsat la necessitat de desenvolupar mètodes que permetin el tractament i organització d’aquestes. Les biomolècules més abundants en l’organisme són les proteïnes i, degut a l’interès que desperten, s’obté d’elles una gran quantitat d’informació que ha esdevingut en un desenvolupament d’eines que en permeten l’anàlisi i el tractament. Un tipus de tractament consisteix en l’agrupament per similitud de seqüència, el qual ens permet associar potencials característiques a una proteïna de la qual només se’n coneix la seqüència, mitjançant la similitud amb altres biomolècules d’aquest grup ja conegudes. Aquesta associació es basa en el fet que seqüències similars semblen esdevenir en estructures semblants, les quals determinen la funció de la proteïna.
L’objectiu d’aquest treball és implementar una eina informàtica que permeti agrupar les proteïnes en base a aquesta similitud per tal de generar Xarxes de Similitud de Seqüència. Per crear-la, s’ha utilitzat el llenguatge de programació Python per generar un script que pren com a input inicial un conjunt de seqüències i genera un fitxer que permet visualitzar-se, usant el software Cytoscape, com una xarxa basada en un llindar de similitud que adjudica l’usuari. S’ha fet una prova inicial per estudiar el funcionament d’aquesta eina amb la família de receptors CD300, un conjunt molècules interessants pel Laboratori de Bioquímica i Biofísica Computacional (CBBL), on s’ha dut a terme aquest treball.
Com ha resultat s’ha obtingut una eina informàtica que permet treballar amb un nombre elevat de seqüències suposant un baix cost computacional gràcies a que treballa amb alineaments per parelles i que, aplicada a la família CD300 dona resultats molt similars als obtinguts mitjançat arbres filogènics. L’avantatge que presenta és que, al tractar-se d’un script generat de novo, permet futures implementacions de metadata, gràcies a les qual també es podrien classificar les molècules segons la seva funció, entre d’altres.
Document Type
Project / Final year job or degree
Language
Catalan
Keywords
Anàlisi de conglomerats
CD300
Pages
44 p.
Note
Curs 2018-2019
This item appears in the following Collection(s)
- Grau en Biotecnologia [139]
Rights
Tots els drets reservats