ABLecture: Aplicació de lectura de subtítols
Author
Other authors
Publication date
2023-06-30Abstract
Títol: ABLecture: aplicació de lectura de subtítols.
Autor: Adrià Barceló Luna
Tutora: Dra. Laura Dempere Marco (UVic)
Data: Juny de 2023
Paraules clau: Lectura de subtítols, OCR (Reconeixement Òptic de Caràcters/Optical Character Recognition), TTS (Text a Veu /Text To Speech), dislèxia, TDHA (trastorno por déficit de atención con hiperactividad).
Aquesta memòria descriu el disseny i el prototipatge d'una aplicació de lectura de subtítols amb l'objectiu de millorar l'experiència de visualització de continguts audiovisuals per a persones amb dificultats lectores. Els subtítols són essencials per a aquelles persones que volen gaudir del contingut en idiomes diferents. La memòria analitza les decisions preses durant el procés de desenvolupament del prototip i les seves implicacions en el disseny final.
L'aplicació utilitza tècniques de visió per computador per aïllar els subtítols de la resta de la imatge i el reconeixement òptic de caràcters (OCR) per extreure el text dels subtítols. També utilitza tecnologies de text a veu (TTS) per convertir-los en veu. La combinació d'aquestes tecnologies permet a l'aplicació oferir una solució completa per a la lectura de subtítols en diferents idiomes i situacions.
L’objectiu principal de l’aplicació és millorar l’experiència de visualització de pel·lícules en idiomes diferents per als usuaris, sempre que hi hagi subtítols disponibles. L’aplicació és accessible per a persones amb dislèxia o dificultats de lectura i atenció, així com per a aquells que volen aprendre idiomes. La memòria destaca la motivació de l’autor per crear aquesta aplicació basant-se en les seves pròpies necessitats, amb l’objectiu de millorar la seva vida quotidiana i fer-la més còmoda i fàcil.
Finalment, en aquest projecte s'ha desenvolupat un prototip funcional que compleix els objectius de l'autor. S'ha recopilat una gran quantitat d'informació per a futurs desenvolupaments i per crear una aplicació funcional que pugui ser distribuïda en un futur proper.
Title: ABLecture, subtitles reading application
Author: Adrià Barceló Luna
Supervisor: Dra. Laura Dempere Marco (UVic)
Date: Juny 2023
Keywords: Optical character recognition (OCR), text-to-speech technologies (TTS), subtitle reading application, dyslexia, ADHD (attention deficit hyperactivity disorder).
This report explains the process of designing and prototyping a subtitle reading application, which aims to improve the visualization experience of audiovisual content for people with reading disorders. Subtitles are essential for those who want to enjoy content in different languages. The report analyzes the decisions made during the prototype development process and their implications in the final design.
The application utilizes computer vision techniques to isolate subtitles from the overall image and optical character recognition (OCR) for text extraction from the image's subtitles. It also employs text-to-speech technologies (TTS) to convert the extracted text into voice. The combination of these technologies allows the application to provide a comprehensive solution for subtitle reading in different languages and situations.
The main objective of the application is to enhance the user's film visualization experience when watching a film in an unfamiliar language with subtitles. The application is accessible for people with reading disorders, as well as for those who want to learn other languages. The report emphasizes the author's motivation for creating this application as a solution to their own needs, with the goal of improving their daily life and making it more comfortable.
Finally, a functional prototype has been developed in this project. A significant amount of information has been collected to facilitate the development of a functional app for possible distribution in the near future.
Document Type
Project / Final year job or degree
Language
Catalan
Keywords
Dislèxia
Trastorn per dèficit d'atenció amb hiperactivitat
Reconeixement òptic de caràcters
Síntesi de la parla (Programari)
Pages
81 p.
Note
Curs 2022-2023
This item appears in the following Collection(s)
Rights
Tots els drets reservats