Участник:Boeing/Рецензия:Применение i-векторов для автоматизированного определения уровня близости языков

Материал из DISCOPAL
< Участник:Boeing
Версия от 15:56, 8 декабря 2021; StasFomin (обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

[1]

Отзыв: Применение i-векторов для автоматизированного определения уровня близости языков (Анс-Атаол Берзинь, ISPRASOPEN-2019)

Доклад рассматривает применение i-векторов для определения близости языков для данных в виде аудиозаписей речи носителей языка. Автор собрал датасет записей пяти диалектов Латвии с целью проверить, насколько близость между i-векторами для этих диалектов отразит их «интуитивную» близость. Здесь встаёт вопрос о том, в каком именно смысле понимается здесь близость между языками/диалектами, и автор при ответе на этот вопрос после доклада сообщает, что имеет бэкграунд в диалектологии и для него похожесть или непохожесть диалектов является тривиальным свойством.

Также была проведена экспертная оценка диалектов датасета и построено бинарное дерево близости, затем автор сравнил расстояние на этом дереве со своими результатами, полученными автоматически — но эта информация не вошла в доклад и была сообщена лишь как ответ на вопрос, тогда как именно это сравнение, на мой взгляд, и является ключевым результатом исследования. Также при анализе результатов работы использовалось предположение о тем большем различии диалектов, чем дальше друг от друга географически живут их носители — интуитивно понятно, но не слишком строго с точки зрения среднего слушателя-не диалектолога.

Сами по себе i-векторы, получаемые из аудиозаписей с естественной речью, были очень кратко объяснены как концепт и им, на мой взгляд, было уделено недостаточное внимание в контексте доклада (для слушателей, ранее не знакомых с этим понятием). Автор строит i-векторы для 5 диалектов с помощью двух автоматических техник построения i-векторов, принципу работы которых также было уделено мало времени. Далее автор производит сравнение таблиц попарных расстояний между диалектами в различных метриках и оценивает осмысленность результатов по сравнению со своими представлении о правильных результатах, что, как указано выше, недостаточно строго. В целом, доклад недостаточно хорошо структурирован (мало внимания ключевым методам), а его результаты не обоснованы (результаты сравнения выхода автоматических методов с экспертными оценками не были приведены).