Прошла конференция «Корпусная линвистика ‒ 2019» в Санкт-Петербурге

9 июля 2019
С 24 по 28 июня 2019 года в Санкт-Петербурге прошла международная конференция «Корпусная линвистика ‒ 2019». В ходе конференции обсуждали теоретические и прикладные вопросы корпусной лингвистики.

Участники конференции «Корпусная лингвистика ‒ 2019»

Организаторами конференции стали кафедра математической лингвистики Санкт-Петербургского государственного университета (СПбГУ) совместно с Институтом лингвистических исследований (ИЛИ РАН) и кафедрой образовательных технологий в филологии Российского государственного педагогического университета им. А. И. Герцена (РГПУ).

Панорама закрытого дворика Филологического факультета СПбГУ. Место отдыха для студентов, сотрудников и гостей университета
Первый день, 24 июня

Школы-семинары конференции открыл А. А. Крижановский. Он провёл мастер-класс «Создание словарных статей в электронном комплексном словаре „Русский Викисловарь“». Было создано несколько новых словарных статей. Слайды презентации доступны онлайн.

Практическое занятие по работе в Русском Викисловаре для участников конференции «Корпусная лингвистика ‒ 2019», Санкт-Петербург

дистрибутивно-семантических моделях, её доклад назывался «Дистрибутивно-семантические модели в лингвистическом процессоре для русского языка».

Ольга Александровна Митрофанова (СПбГУ) рассказывает о дистрибутивно-семантических моделях

О. А. Митрофанова с коллегами и учениками разработали DSM-калькулятор, которым и воспользовались участники семинара в учебных целях. По этой же ссылке можно увидеть и потестировать семантический калькулятор и ESA-калькулятор.

Анна Крюкова, ученица О. А. Митрофановой и сотрудница PROMT, выступает с докладом о реализации метода ESA для русского языка
Третий день, 26 июня

Сразу два доклада были связаны с корпусом Ru-RSTreebank. Это русскоязычный дискурсивный корпус, тексты в нём размечены в рамках Теории риторической структуры, разработанной в Сандрой Томпсон.

Алексей Михайлович Лаврентьев

Соколова Елена Григорьевна проанализировала свойства двух риторических отношений «контраст» и «сравнение» на данных корпуса Ru-RSTreebank (см. видео).

Татарского национального корпуса «Туган тел» (см. видео).

Проект CoCoCo представил Хельсинкский университет). Это забавное название CoCoCo складывается из начала слов «Collocations, Colligations, and Corpora» (см. видео).

Видеоматериалы к некоторым докладам третьего дня:

Brexit».

Vlatko Broz представил доклад "A corpus-based critical discourse analysis of Brexit in the English language press"

Словенского языка коснулся Korpus bibliotekarstva.

Korpus bibliotekarstva

текст доклада.

sites.google.com/site/ruslandict.

Ирина Владимировна Азарова (СПбГУ) рассказала о вычислительной онтологии русских предлогов.

Weka.

Виктория Бобичева представила решение задачи определения авторства текста в научных публикациях
Четвёртый день, 27 июня

тематического моделирования.

Использовалась компьютерная программа scikit-learn, в которой реализована модель LDA. Для визуализации результатов тематического моделирования использовалась библиотека pyLDAvis. После извлечения текста из библиотеки Мошкова получено порядка 120 тысяч словоупотреблений. В тематической модели было выделено 30 тем, по 30 первых слов в выдаче.

Исследование подтвердило выводы литературоведов, в частности есть чёткое противопоставление двух тем романа (роман-Е в романе-М) в построенной тематической модели. Найденные различия между фрагментами текста указывают (1) на создание романа за большой промежуток времени, (2) на стилистическую неоднородность: роман-Е близок к историческому повествованию, роман-М по стилю близок к сатирическим произведениям.

О. А. Митрофанова рассказала об исследовании структуры романа «Мастер и Маргарита» М. А. Булгакова с помощью методов тематического моделирования. На слайде дана тема № 4: Варенуха, Римский, финдиректор… и ещё 27 слов темы

Татьяна Юрьевна Шерстинова рассказала о создаваемой биографической базе данных русских писателей. Для наполнения базы были использованы разные ресурсы, в том числе:

База данных включает не только сведения о писателях, но и тексты произведений. По-видимому, в Интернете эта интереснейшая база пока не представлена.

Т. Ю. Шерстинова. Наиболее исследуемые русские писатели. Доклад «Биографическая база данных русских писателей (к созданию корпуса русского рассказа XX века)»


Сергей Александрович Крылов прочитал доклад Андрея Платонова (см. видео).

Перерыв между докладами. На заднем плане — неизвестная картина… На стенде — фотографии сотрудников университета, ушедших на войну и работавших в тылу, в блокаде (или «в блокаду»)

Виктор Павлович Захаров и Татьяна Юрьевна Шерстинова рассказали о жизни, творчестве и многогранном таланте Григория Яковлевича Мартыненко (см. видео).

Увлекательнейший доклад Г. Я. Мартыненко о стилизованных синтаксических триадах на примере повести Артёма Весёлого «Реки огненные» представила Татьяна Юрьевна (см. видео).

Видеоматериалы к некоторым докладам третьего дня:

Silk-film.png Внешние видеофайлы
Silk-film.png Доклад О. Е. Фроловой «Корпус как инструмент исследования художественного текста» читает С. А. Крылов.
Silk-film.png Доклад П. В. Паничевой «Анализ семантической связности в корпусах текстов для задач лингвистики и смежных областей».
Пятый день, 28 июня

ижорских народных песнях

Андрей Анатольевич Крижановский (ИПМИ КарНЦ РАН) рассказал о разнообразии диалектов карельского языка и об Открытом корпусе вепсского и карельского языков, разрабатываемом в Петрозаводске в Карельском научном центре РАН. См. слайды и текст доклада «Представление диалектов в Открытом корпусе вепсского и карельского языков (ВепКар)».

Национального корпуса русского языка.

XIX века.

пример).

XML-разметки. Используется программное обеспечение TXM, представленное в следующем докладе.

язык запросов CQP.

www.manuscripts.ru.

Видеоматериалы к некоторым докладам пятого дня:

Участники конференции во дворике Филологического факультета СПбГУ


 

См. также

Материалы

Источники

Оригинальный репортаж

Эта статья опубликована в Викиновостях и содержит эксклюзивный репортаж и исследования, написанные одним из участников нашего проекта специально для Викиновостей.

Если автор репортажа не указал свои источники, источником информации является он сам. Вы можете узнать, кто создал эту статью, из истории статьи: найдите в ней самую первую правку; тот, кто её внёс, и является автором статьи. Если у вас есть замечания или предложения, первым делом напишите о них на напишите на форум.

Ссылки

Комментарии

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.
 


  • Спасибо организаторам конференции за прекрасную организацию!
  • На следующей конференции было бы интересно пройти мастер-класс и попрактиковаться в работе с платформой TXM, о которой в своих докладах говорили Елена Андреевна Рогозина и Алексей Михайлович Лаврентьев. --Andrew Krizhanovsky (обсуждение) 07:07, 8 июля 2019 (UTC)
 


Прошла конференция «Корпусная линвистика ‒ 2019» в Санкт-Петербурге
Авторы