Катедра по математическа логика и приложенията ѝ


English version Bulgarian version

Магистърска програма по „Компютърна лингвистика“

Презентация на програмата юни 2016

Презентация на програмата юни 2016 (озвучена версия)

В магистърската програма по Компютърна лингвистика студентите изучават математическите, лингвистичните и алгоритмичните принципи, които са в основата на съвременните технологии за машинно (само)обучение в областта на автоматичната обработката на естествен език (NLP).
Целта на програмата е да създаде кадри, които не само разбират и могат да реализират съществуващи технологии в областта на Компютърната лингвистика, но са в състояние да създават качествено нови модели и алгоритми за решаването на проблеми от тази област.

С тези качества, успешно завършилите магистри в специалност Компютърна лингвистика могат да получат професионална реализация в:
1. IT-екипи за осъвършенстване и подобряване на съществуващи NLP-технологии.
2. изследователски екипи на IT-компании и научни организации в България и по света за създаването на технологии от ново поколение за обработка на естествени езици.

По време на обучението си, наред с фундаменталните знания, които получават, се стремим студентите да получат възможност и да участват и в изследователски проекти в които да упражняват придобитите знания и да натрупат допълнителни практически умения. Магистрите в програма Компютърна лингвистика също се стимулират да създават оригинални научни идеи, които да могат да аргументират и да реализират на практика. Това се постига не само в рамките на учебния процес, но и с възможности за участие в международни форуми като конференции, работни срещи и състезания, свързани с тематиката на магистърската програма.

Успехи на магистрите по Компютърна лингвистика

2016, май: Нели Хатева представя работата си по създаването на речеви корпус за български език на международната конференция Language Resources and Evaluation 2016 в Portorož, Словения.
Работата е ръководена от доцент Стоян Михов и доктор Петър Митанкин.

2015, май: Системата Voltron, разработена от нашите студенти Иван Заманов, Нели Хатева, Марина Краева и Ивана Йовчева се представя достойно на международното състезание за Question Answering технологии SemEval-2015 в рамките на International Workshop on Semantic Evaluation 2015, Denver, Colorado, САЩ.
Отборът е напътстван от професор Галя Ангелова и доктор Ивелина Николова.

Проекти

Проекти от областта на компютърната лингвистика, в които са участвали представители на преподавателския екип в програмата:
ISALTeC – неинформиран анализ на текст за извличане на фрази (FP7 на ЕК) – (2014-2016)
CULTURA – машинен превод от средновековен на модерен език (FP7 на ЕК) – (2011-2014)
IMPACT – корекция на исторически текстове (FP7 на ЕК) – (2008-2012)
Разпознаване на българска реч (Национален научен фонд) – (2006-2008)
SpeechLab – синтез на българска реч (частично финансиране от Microsoft) – (2004-2005)
OCORRECT – корекция на OCR текстове (Volkswagenstiftung) – (2002-2008)

Учебен план

I семестър
1. Общо езикознание (2+2), задължителен
2. Търсене и извличане на информация. Приложение на дълбоко машинно обучение (2+2), задължителен
3. Бързи алгоритми върху структури от данни (2+2), задължителен
4. Основи на статистическата обработка на естествен език. Теория на информацията (4+0), задължителен
5. Практикум по машинен превод (1+2), задължителен
II семестър
1. Практикум по формален подход в компютърната лингвистика (1+2), изборен
2. Приложения на крайните автомати (3+2), изборен
3. Ламбда смятане и теория на доказателствата (3+1), изборен
4. Машини, езици, сложност и изчислимост (3+2), изборен
5. Дескриптивни логики (3+2), изборен
6. Теория на машинното обучение и някои нейни приложения в невронните мрежи (3+2), изборен
III семестър
1. Представяне, извличане и търсене на концептуални знания (3+1), изборен
2. Игри и логика
3. Коригиране на OCR разпознати текстове и анализ на документи (1+2), изборен
4. Стандарти и системи за обработка на естествен език (1+2), изборен
5. Разработване и защита на дипломна работа

Повече информация може да намерите тук.