Введение в компьютерную лингвистику
Программа спецкурса
Лекторы:
доцент, к.ф.-м.н. И. А. Волкова
доцент, к.ф.-м.н. Т. Ю. Грацианова
Введение
Автоматическая обработка текстов. Актуальность. Трудности. Классификация систем автоматической обработки текстов. Типы прикладных задач, решаемых с помощью АОТ-систем. Машинный перевод. Генерация текста.
Локализация и интернационализация. Работа на ограниченном языке. Создание текстовых документов. Поиск информации.
Информационно-поисковые системы. Основные определения. Тезаурус
ИПС: релевантность. Языковой компонент.
Системы, моделирующие общение с пользователем на естественном языке. Eliza и ей подобные; современные чат-боты.
Человеко-машинный интерфейс. Лингвистический и нелингвистический компоненты.
Лингвистическое обеспечение систем автоматической обработки текстов. Лингвистические банки данных.
Системы автоматической обработки текстов на естественном языке (АОТ-системы).
Область применения АОТ-систем, аспекты изучения языка, языковые уровни, лингвистические процессоры.
Морфологический компонент АОТ-систем.
морфологические базы данных,
морфологическая омонимия,
морфологическая парадигма,
а) морфологические анализаторы и синтезаторы,
грамматический словарь русского языка А.А.Зализняка.
Синтаксический компонент АОТ-систем.
способы представления синтаксических структур предложения,
понятие проективности предложения,
синтаксический анализ на основе сетевой грамматики,
понятие синтаксической модели управления,
основные алгоритмы синтаксического анализа предложений естественнного языка.
Семантический компонент АОТ-систем.
теория концептуальной зависимости Р. Шенка,
теория лингвистических моделей «СМЫСЛ<=>ТЕКСТ»,
теория А. П. Журавлева о соотношении звука и смысла.
Прагматический компонент в АОТ-системах.
Анализ связного текста в АОТ-системах.
Исправление ошибок в русскоязычных текстах. Система комплексного контроля качества текста ЛИНАР: функции системы, сценарии работы.
База знаний системы ЛИНАР. Программы контроля.