Implementació d’un programa de clusterització de proteïnes basat en la similitud de seqüència i aplicat en la caracterització dels receptors CD300

Vilalta Carrera, Alba; Vilalta Carrera, Alba

Data de publicació

2019-06

URI http://hdl.handle.net/10854/5854

Resum

L’augment exponencial de dades obtingudes en biologia molecular degut a la implementació de tècniques d’alt rendiment ha impulsat la necessitat de desenvolupar mètodes que permetin el tractament i organització d’aquestes. Les biomolècules més abundants en l’organisme són les proteïnes i, degut a l’interès que desperten, s’obté d’elles una gran quantitat d’informació que ha esdevingut en un desenvolupament d’eines que en permeten l’anàlisi i el tractament. Un tipus de tractament consisteix en l’agrupament per similitud de seqüència, el qual ens permet associar potencials característiques a una proteïna de la qual només se’n coneix la seqüència, mitjançant la similitud amb altres biomolècules d’aquest grup ja conegudes. Aquesta associació es basa en el fet que seqüències similars semblen esdevenir en estructures semblants, les quals determinen la funció de la proteïna. L’objectiu d’aquest treball és implementar una eina informàtica que permeti agrupar les proteïnes en base a aquesta similitud per tal de generar Xarxes de Similitud de Seqüència. Per crear-la, s’ha utilitzat el llenguatge de programació Python per generar un script que pren com a input inicial un conjunt de seqüències i genera un fitxer que permet visualitzar-se, usant el software Cytoscape, com una xarxa basada en un llindar de similitud que adjudica l’usuari. S’ha fet una prova inicial per estudiar el funcionament d’aquesta eina amb la família de receptors CD300, un conjunt molècules interessants pel Laboratori de Bioquímica i Biofísica Computacional (CBBL), on s’ha dut a terme aquest treball. Com ha resultat s’ha obtingut una eina informàtica que permet treballar amb un nombre elevat de seqüències suposant un baix cost computacional gràcies a que treballa amb alineaments per parelles i que, aplicada a la família CD300 dona resultats molt similars als obtinguts mitjançat arbres filogènics. L’avantatge que presenta és que, al tractar-se d’un script generat de novo, permet futures implementacions de metadata, gràcies a les qual també es podrien classificar les molècules segons la seva funció, entre d’altres.

Tipus de document

Projecte/Treball fi de carrera o de grau

Llengua

Català

Paraules clau

Anàlisi de conglomerats

CD300

Pàgines

44 p.

Nota

Curs 2018-2019

Citació recomanada

Aquesta citació s'ha generat automàticament.

Mostra el registre complet de l'element

Aquest element apareix en la col·lecció o col·leccions següent(s)

Grau en Biotecnologia [141]

Drets

Tots els drets reservats