Участник:Boeing/Рецензия:Применение i-векторов для автоматизированного определения уровня близости языков

Материал из DISCOPAL
< Участник:Boeing
Версия от 16:41, 7 ноября 2021; Boeing (обсуждение | вклад) (Новая страница: «[https://0x1.tv/%D0%9F%D1%80%D0%B8%D0%BC%D0%B5%D0%BD%D0%B5%D0%BD%D0%B8%D0%B5_i-%D0%B2%D0%B5%D0%BA%D1%82%D0%BE%D1%80%D0%BE%D0%B2_%D0%B4%D0%BB%D1%8F_%D0%B0%D0%B2%D1…»)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

[1]

Отзыв: Применение i-векторов для автоматизированного определения уровня близости языков (Анс-Атаол Берзинь, ISPRASOPEN-2019)

Доклад рассматривает применение i-векторов для определения близости языков для данных в виде аудиозаписей речи носителей языка. Автор собрал датасет записей пяти диалектов Латвии с целью проверить, насколько близость между i-векторами для этих диалектов отразит их "интуитивную" близость. Здесь встаёт вопрос о том, в каком именно смысле понимается здесь близость между языками/диалектами, и автор при ответе на этот вопрос после доклада сообщает, что имеет бэкграунд в диалектологии и для него похожесть или непохожесть диалектов является тривиальным свойством. Также была проведена экспертная оценка диалектов датасета и построено бинарное дерево близости, затем автор сравнил расстояние на этом дереве со своими результатами, полученными автоматически - но эта информация не вошла в доклад и была сообщена лишь как ответ на вопрос, тогда как именно это сравнение, на мой взгляд, и является ключевым результатом исследования. Также при анализе результатов работы использовалось предположение о тем большем различии диалектов, чем дальше друг от друга географически живут их носители - интуитивно понятно, но не слишком строго с точки зрения среднего слушателя-не диалектолога. Сами по себе i-векторы, получаемые из аудиозаписей с естественной речью, были очень кратко объяснены как концепт и им, на мой взгляд, было уделено недостаточное внимание в контексте доклада (для слушателей, ранее не знакомых с этим понятием). Автор строит i-векторы для 5 диалектов с помощью двух автоматических техник построения i-векторов, принципу работы которых также было уделено мало времени. Далее автор производит сравнение таблиц попарных расстояний между диалектами в различных метриках и оценивает осмысленность результатов по сравнению со своими представлении о правильных результатах, что как указано выше, недостаточно строго. В целом, доклад недостаточно хорошо структурирован (мало внимания ключевым методам), а его результаты не обоснованы (сравнение и экспертными оценками не были приведены).