Участник:Boeing/Рецензия:Применение i-векторов для автоматизированного определения уровня близости языков — различия между версиями
Boeing (обсуждение | вклад) (→Отзыв: Применение i-векторов для автоматизированного определения уровня близости языков (Анс-Атаол Берзинь, ISPRASOPEN-2019)) |
StasFomin (обсуждение | вклад) |
||
(не показана 1 промежуточная версия 1 участника) | |||
Строка 3: | Строка 3: | ||
== Отзыв: Применение i-векторов для автоматизированного определения уровня близости языков (Анс-Атаол Берзинь, ISPRASOPEN-2019) == | == Отзыв: Применение i-векторов для автоматизированного определения уровня близости языков (Анс-Атаол Берзинь, ISPRASOPEN-2019) == | ||
− | Доклад рассматривает применение i-векторов для определения близости языков для данных в виде аудиозаписей речи носителей языка. Автор собрал датасет записей пяти диалектов Латвии с целью проверить, насколько близость между i-векторами для этих диалектов отразит их | + | Доклад рассматривает применение i-векторов для определения близости языков для данных в виде аудиозаписей речи носителей языка. Автор собрал датасет записей пяти диалектов Латвии с целью проверить, насколько близость между i-векторами для этих диалектов отразит их «интуитивную» близость. Здесь встаёт вопрос о том, в каком именно смысле понимается здесь близость между языками/диалектами, и автор при ответе на этот вопрос после доклада сообщает, что имеет бэкграунд в диалектологии и для него похожесть или непохожесть диалектов является тривиальным свойством. |
+ | |||
+ | Также была проведена экспертная оценка диалектов датасета и построено бинарное дерево близости, затем автор сравнил расстояние на этом дереве со своими результатами, полученными автоматически — но эта информация не вошла в доклад и была сообщена лишь как ответ на вопрос, тогда как именно это сравнение, на мой взгляд, и является ключевым результатом исследования. Также при анализе результатов работы использовалось предположение о тем большем различии диалектов, чем дальше друг от друга географически живут их носители — интуитивно понятно, но не слишком строго с точки зрения среднего слушателя-не диалектолога. | ||
+ | |||
+ | Сами по себе i-векторы, получаемые из аудиозаписей с естественной речью, были очень кратко объяснены как концепт и им, на мой взгляд, было уделено недостаточное внимание в контексте доклада (для слушателей, ранее не знакомых с этим понятием). Автор строит i-векторы для 5 диалектов с помощью двух автоматических техник построения i-векторов, принципу работы которых также было уделено мало времени. Далее автор производит сравнение таблиц попарных расстояний между диалектами в различных метриках и оценивает осмысленность результатов по сравнению со своими представлении о правильных результатах, что, как указано выше, недостаточно строго. В целом, доклад недостаточно хорошо структурирован (мало внимания ключевым методам), а его результаты не обоснованы (результаты сравнения выхода автоматических методов с экспертными оценками не были приведены). |
Текущая версия на 15:56, 8 декабря 2021
Отзыв: Применение i-векторов для автоматизированного определения уровня близости языков (Анс-Атаол Берзинь, ISPRASOPEN-2019)
Доклад рассматривает применение i-векторов для определения близости языков для данных в виде аудиозаписей речи носителей языка. Автор собрал датасет записей пяти диалектов Латвии с целью проверить, насколько близость между i-векторами для этих диалектов отразит их «интуитивную» близость. Здесь встаёт вопрос о том, в каком именно смысле понимается здесь близость между языками/диалектами, и автор при ответе на этот вопрос после доклада сообщает, что имеет бэкграунд в диалектологии и для него похожесть или непохожесть диалектов является тривиальным свойством.
Также была проведена экспертная оценка диалектов датасета и построено бинарное дерево близости, затем автор сравнил расстояние на этом дереве со своими результатами, полученными автоматически — но эта информация не вошла в доклад и была сообщена лишь как ответ на вопрос, тогда как именно это сравнение, на мой взгляд, и является ключевым результатом исследования. Также при анализе результатов работы использовалось предположение о тем большем различии диалектов, чем дальше друг от друга географически живут их носители — интуитивно понятно, но не слишком строго с точки зрения среднего слушателя-не диалектолога.
Сами по себе i-векторы, получаемые из аудиозаписей с естественной речью, были очень кратко объяснены как концепт и им, на мой взгляд, было уделено недостаточное внимание в контексте доклада (для слушателей, ранее не знакомых с этим понятием). Автор строит i-векторы для 5 диалектов с помощью двух автоматических техник построения i-векторов, принципу работы которых также было уделено мало времени. Далее автор производит сравнение таблиц попарных расстояний между диалектами в различных метриках и оценивает осмысленность результатов по сравнению со своими представлении о правильных результатах, что, как указано выше, недостаточно строго. В целом, доклад недостаточно хорошо структурирован (мало внимания ключевым методам), а его результаты не обоснованы (результаты сравнения выхода автоматических методов с экспертными оценками не были приведены).