Identifying Data 2019/20
Subject (*) Computational intelligence for bioinformatics Code 614522012
Study programme
Mestrado Universitario en Bioinformática para Ciencias da Saúde
Descriptors Cycle Period Year Type Credits
Official Master's Degree 2nd four-month period
First Obligatory 6
Language
Spanish
Teaching method Face-to-face
Prerequisites
Department Ciencias da Computación e Tecnoloxías da Información
Computación
Coordinador
Guijarro Berdiñas, Berta M.
E-mail
berta.guijarro@udc.es
Lecturers
Guijarro Berdiñas, Berta M.
Pérez Sánchez, Beatriz
Sanchez Maroño, Noelia
E-mail
berta.guijarro@udc.es
beatriz.perezs@udc.es
noelia.sanchez@udc.es
Web http://moodle.udc.es
General description A aprendizaxe é unha característica central da intelixencia, e a posibilidade de construír sistemas computerizados capaces de adaptarse á súa contorna aprendendo del é unha cuestión que cada vez suscita máis interese.
Este tipo de sistemas resultan especialmente útiles cando se trata de modelar unha tarefa para a que non existe unha experiencia humana de partida da que extraer un algoritmo, cando este non é fácil de extraer ou cando é necesario analizar un conxunto de datos para poder extraer coñecemento deles. As técnicas de Aprendizaxe Automático permítennos programar estas tarefas utilizando unicamente datos de exemplo ou experiencias pasadas. Neste curso estúdanse as diversas aproximacións aos problemas de aprendizaxe, as súas vantaxes e limitacións, o tipo de problemas para os que son máis adecuadas, así como as condicións de desenvolvemento que deben terse en conta para que este tipo de sistemas e modelos sexan o máis fiable posible.

Study programme competencies
Code Study programme competences
A2 CE2 – To define, evaluate and select the architecture and the most suitable software for solving a problem in the field of bioinformatics
A3 CE3 – To analyze, design, develop, implement, verify and document efficient software solutions based on an adequate knowledge of the theories, models and techniques in the field of Bioinformatics
A4 CE4 - Ability to acquire, obtain, formalize and represent human knowledge in a computable form for the resolution of problems through a computer system in any field of application, particularly those related to aspects of computing, perception and action in bioinformatics applications
A6 CE6 - Ability to identify software tools and most relevant bioinformatics data sources, and acquire skill in their use
B1 CB6 - Own and understand knowledge that can provide a base or opportunity to be original in the development and/or application of ideas, often in a context of research
B2 CB7 - Students should know how to apply the acquired knowledge and ability to problem solving in new environments or little known within broad (or multidisciplinary) contexts related to their field of study
B3 CB8 - Students to be able to integrate knowledge and deal with the complexity of making judgements from information that could be incomplete or limited, including reflections on the social and ethical responsibilities linked to the application of their skills and judgments
B6 CG1 -Search for and select the useful information needed to solve complex problems, driving fluently bibliographical sources for the field
B7 CG2 - Maintain and extend well-founded theoretical approaches to enable the introduction and exploitation of new and advanced technologies
C1 CT1 - Express oneself correctly, both orally writing, in the official languages of the autonomous community
C3 CT3 - Use the basic tools of the information technology and communications (ICT) necessary for the exercise of their profession and lifelong learning
C6 CT6 - To assess critically the knowledge, technology and information available to solve the problems they face to.

Learning aims
Learning outcomes Study programme competences
Coñecer e comprender os paradigmas e aspectos máis relevantes do tratamento de datos en bioinformática AJ4
BJ1
BJ7
CJ6
Coñecer os principais métodos de aprendizaxe a partir de datos, saber qué tipos principais existen e saber cómo aplicalos. AJ2
AJ3
AJ4
AJ6
BJ1
BJ2
BJ3
BJ6
CJ1
CJ3
CJ6
Coñecer os métodos de redución da dimensionalidade AJ3
AJ4
BJ1
BJ3
BJ7
CJ6
Saber como debe avaliarse un modelo baseado en datos AJ2
AJ3
AJ6
BJ3
Coñecer as plataformas e as ferramentas dispoñibles no campo da Intelixencia Computacional. AJ2
AJ3
AJ6
BJ2
CJ3
CJ6

Contents
Topic Sub-topic
TEMA 1: Introducción á aprendizaxe 1.1. Areas de aplicación e tipos de problemas
1.2. Características dos sistemas de aprendizaxe
1.3. Perspectiva xeral das distintas aproximacións e tipos de aprendizaxe
TEMA 2: Teoría da aprendizaxe computacional 2.1. O problema da precisión.
2.2. A dimensión Vapnik-Chervonenkis
2.3. A maldición da dimensionalidade
TEMA 3: Aprendizaxe estatística 3.1. O discriminante lineal de Fisher
3.2. Outros tipos de discriminantes
TEMA 4: Aprendizaxe baseada en árboles e reglas de decisión 4.1. Obxetivo da IA simbólica
4.2. Xeneralidades dos algoritmos de aprendizaxe en IA simbólica
4.3. Listas de decisión
4.4. Inducción de reglas
4.5. Árboles de decisión
4.6. Medidas de rendimiento: entropía e información mutua
TEMA 5: Redes de neuronas artificiais 5.1. Conceptos básicos
5.2. O Perceptrón multicapa
5.3. Outros modelos
TEMA 6: Aprendizaxe baseada en kernels 6.1. Nomenclatura e definicións previas
6.2. SVMs lineais
6.3. SVMs non lineais
6.4. SVM Multiclase
TEMA 7: Métodos de aprendizaxe non supervisados 7.1. Análisis cluster
7.2. Análisis cluster xerárquico
7.3. Análisis cluster iterativo
7.4. Mapas autoorganizativos
TEMA 8: Aprendizaxe semisupervisada. 8.1 Aprendizaxe por reforzo
TEMA 9: Métodos de reducción da dimensión 9.1. Extracción de características
9.2. Selección de características
TEMA 10: Metodoloxía experimental e análise de resultados 10.1. Diseño experimental
10.2. Preprocesado de datos
10.3. Métodos para a estimación do error
10.4. Métodos de selección de modelos

Planning
Methodologies / tests Competencies Ordinary class hours Student’s personal work hours Total hours
Guest lecture / keynote speech A2 A3 A4 B1 B3 B7 C6 14 21 35
Supervised projects A2 A3 A4 A6 B1 B2 B3 B6 C3 C6 0 29 29
Laboratory practice A2 A3 A4 A6 B2 C3 27 27 54
Oral presentation B3 C1 C6 3 3 6
Objective test A2 A3 A4 A6 B2 C1 C6 2 18 20
 
Personalized attention 6 0 6
 
(*)The information in the planning table is for guidance only and does not take into account the heterogeneity of the students.

Methodologies
Methodologies Description
Guest lecture / keynote speech Exposición oral dos contidos que conforman o marco teórico da materia, complementada co uso de medios audiovisuais e a introdución dalgunhas preguntas dirixidas aos estudantes, co obxectivo de transmitir coñecemento así como de estimular o razoamento crítico do estudante.
Supervised projects Realizaranse varios traballos relacionados cos bloques principais da materia: técnicas de aprendizaxe básicas, técnicas avanzadas e técnicas de selección e extracción de características. Consistirán en actividades de carácter práctico a través das cales se expoñen situacións que requiren ao estudante identificar o problema obxecto de estudo, formulalo con precisión, desenvolver os procedementos pertinentes, aplicar as técnicas vistas en clase, interpretar os resultados e sacar as conclusións oportunas do traballo realizado. Inclúe sesións periódicas co profesor para o seguimento.
Laboratory practice Actividade que permitirá aos estudantes familiarizarse coas ferramentas, plataformas e conxuntos de datos máis comúns no ámbito da aprendizaxe computacional na bioinformática. O obxectivo é que apliquen e asimilen efectivamente os contidos teóricos a través da realización de actividades de carácter práctico, tales como exercicios, experimentos, simulacións e investigacións.
Oral presentation Ao finalizar cada práctica e traballo tutelado os estudantes deben preparar unha sinxela presentación cos principais resultados, conclusións e achegas e expor o traballo realizado na aula.
Objective test Proba escrita utilizada como actividade para a avaliación individual da aprendizaxe.

Personalized attention
Methodologies
Laboratory practice
Supervised projects
Description
O traballo tutelado realizarase, en parte, durante as prácticas de laboratorio e, en gran parte, como traballo autónomo. Para o seu correcto desenvolvemento será necesario tanto o seguimento periódico, co fin de guialo e asegurar a súa calidade, como permitir aos alumnos aclarar co profesor dubidas particulares do proxecto. Para iso establecerase un calendario de tutorías presenciais que acabará na presentación oral dos resultados. Tamén se poderán atender dúbidas, puntualmente, a través do correo electrónico.

Assessment
Methodologies Competencies Description Qualification
Laboratory practice A2 A3 A4 A6 B2 C3 Prácticas en grupo de realización OBRIGATORIA que abordarán cada un dos temas da materia.
Son OBRIGATORIAS para poder aprobar e inflúen na cualificación final do traballo tutelado, pero non se puntúan á marxe deste.
0
Supervised projects A2 A3 A4 A6 B1 B2 B3 B6 C3 C6 Traballo en grupo de realización OBRIGATORIA que abordará cada un dos temas da materia. Realizarase en diversas fases ao longo do curso e supón unha avaliación completa e contínua sobre todos os aspectos teóricos e prácticos da materia. Inclúe tamén un seguimento de participación activa por parte do estudante.

As condicións e contido concreto detallaranse durante o curso.

Dada a relación direita co contido das prácticas a nota deste apartado inclúe a avaliación das mesmas.
Non se poderá aprobar a materia se se obtén unha puntuación inferior a 5 neste apartado.
95
Oral presentation B3 C1 C6 Periodicamente establécense sesións de presentación e discusión dos detalles dos traballos tutelados (e as prácticas), os resultados obtidos e as conclusións extraídas.

É OBRIGATORIA para poder aprobar e inflúe na cualificación final do traballo tutelado, pero non se puntúa á marxe deste.

0
Objective test A2 A3 A4 A6 B2 C1 C6 Proba escrita utilizada para a avaliación da aprendizaxe de todos ou algúns dos temas da materia.
Poderán realizarse varias probas o longo do curso co fin de facer unha avaliación continua.
5
 
Assessment comments
OUTRAS NORMAS DE EVALUACIÓN DA ASIGNATURA

- A entrega das prácticas e a súa presentación nas datas e horarios indicados, así como a
asistencia ás clases de prácticas son obrigatorias para aprobar a
asignatura.

- Un alumno considerarase presentado nunha convocatoria se participa en máis do 50% das actividades de avaliación.

- De acordo ao artigo 14, apartado 4, da normativa*, o plaxio dos
traballos prácticos conlevará unha nota global de SUSPENSO  na convocatoria anual  tanto para o
estudante que presente material copiado como para quen o facilitase.

Matrícula a tempo parcial

- En caso de matrícula a tempo parcial elimínase a obrigatoriedade da asistencia ás clases de prácticas, pero non a entrega de traballos nin a asistencia ás presentacións orais dos mesmos nas condicións e prazos específicos que se establecerán. Será obriga do estudante comunicar a súa situación ao profesorado.

* Normativa de avaliación, revisión e reclamación das cualificacións dos
estudos de grao e máster universitario, aprobada polo Consello de
Goberno da Universidade da Coruña o 19 de decembro de 2013.


Sources of information
Basic 2nd Edition byBerthold R. (Editor), Hand D.J. (Editor) (1999). Intelligent Data Analysis . Springer. https://www.researchgate.net/publication/235945820_Intelligent_Data_Analysis_An_Introducti
Alpaydin, E. (2004). Introduction to Machine Learning. The MIT Press
Nilsson, N. J. (1996). Introduction to Machine Learning. Draft of Incomplete Notes. http://robotics.stanford.edu/people/nilsson/mlbook.html
Mitchell, T. (1997). Machine Learning. WCB/McGraw-Hill
Michie, D., Spiegelhalter, D. J., Taylor, C. C., (editores) (1994). Machine Learning: Neural and statistical classification. Ellis Horwood. https://www.researchgate.net/publication/2335004_Machine_Learning_Neural_and_Statisti
Bishop, C. (1996). Neural Networks for Pattern Recognition. Oxford University Press

Complementary


Recommendations
Subjects that it is recommended to have taken before
Introduction to programming/614522001
Foundations of Artificial Intelligence/614522003

Subjects that are recommended to be taken simultaneously
Advanced statistical methods in bioinformatics/614522009
Probability. statistics and elements of biomathematics/614522007

Subjects that continue the syllabus
Computational intelligence for high dimensional data/614522024

Other comments


(*)The teaching guide is the document in which the URV publishes the information about all its courses. It is a public document and cannot be modified. Only in exceptional cases can it be revised by the competent agent or duly revised so that it is in line with current legislation.