Implementació d’un programa de clusterització de proteïnes basat en la similitud de seqüència i aplicat en la caracterització dels receptors CD300

Vilalta Carrera, Alba; Vilalta Carrera, Alba

Publication date

2019-06

URI http://hdl.handle.net/10854/5854

Abstract

L’augment exponencial de dades obtingudes en biologia molecular degut a la implementació de tècniques d’alt rendiment ha impulsat la necessitat de desenvolupar mètodes que permetin el tractament i organització d’aquestes. Les biomolècules més abundants en l’organisme són les proteïnes i, degut a l’interès que desperten, s’obté d’elles una gran quantitat d’informació que ha esdevingut en un desenvolupament d’eines que en permeten l’anàlisi i el tractament. Un tipus de tractament consisteix en l’agrupament per similitud de seqüència, el qual ens permet associar potencials característiques a una proteïna de la qual només se’n coneix la seqüència, mitjançant la similitud amb altres biomolècules d’aquest grup ja conegudes. Aquesta associació es basa en el fet que seqüències similars semblen esdevenir en estructures semblants, les quals determinen la funció de la proteïna. L’objectiu d’aquest treball és implementar una eina informàtica que permeti agrupar les proteïnes en base a aquesta similitud per tal de generar Xarxes de Similitud de Seqüència. Per crear-la, s’ha utilitzat el llenguatge de programació Python per generar un script que pren com a input inicial un conjunt de seqüències i genera un fitxer que permet visualitzar-se, usant el software Cytoscape, com una xarxa basada en un llindar de similitud que adjudica l’usuari. S’ha fet una prova inicial per estudiar el funcionament d’aquesta eina amb la família de receptors CD300, un conjunt molècules interessants pel Laboratori de Bioquímica i Biofísica Computacional (CBBL), on s’ha dut a terme aquest treball. Com ha resultat s’ha obtingut una eina informàtica que permet treballar amb un nombre elevat de seqüències suposant un baix cost computacional gràcies a que treballa amb alineaments per parelles i que, aplicada a la família CD300 dona resultats molt similars als obtinguts mitjançat arbres filogènics. L’avantatge que presenta és que, al tractar-se d’un script generat de novo, permet futures implementacions de metadata, gràcies a les qual també es podrien classificar les molècules segons la seva funció, entre d’altres.

Document Type

Project / Final year job or degree

Language

Catalan

Keywords

Anàlisi de conglomerats

CD300

Pages

44 p.

Note

Curs 2018-2019

Recommended citation

This citation was generated automatically.

Show full item record

This item appears in the following Collection(s)

Grau en Biotecnologia [141]

Rights

Tots els drets reservats