Участник:Boeing/Рецензия:Применение i-векторов для автоматизированного определения уровня близости языков — различия между версиями

Материал из DISCOPAL
Перейти к: навигация, поиск
(Отзыв: Применение i-векторов для автоматизированного определения уровня близости языков (Анс-Атаол Берзинь, ISPRASOPEN-2019))
 
(не показана 1 промежуточная версия 1 участника)
Строка 3: Строка 3:
 
== Отзыв: Применение i-векторов для автоматизированного определения уровня близости языков (Анс-Атаол Берзинь, ISPRASOPEN-2019) ==
 
== Отзыв: Применение i-векторов для автоматизированного определения уровня близости языков (Анс-Атаол Берзинь, ISPRASOPEN-2019) ==
  
Доклад рассматривает применение i-векторов для определения близости языков для данных в виде аудиозаписей речи носителей языка. Автор собрал датасет записей пяти диалектов Латвии с целью проверить, насколько близость между i-векторами для этих диалектов отразит их "интуитивную" близость. Здесь встаёт вопрос о том, в каком именно смысле понимается здесь близость между языками/диалектами, и автор при ответе на этот вопрос после доклада сообщает, что имеет бэкграунд в диалектологии и для него похожесть или непохожесть диалектов является тривиальным свойством. Также была проведена экспертная оценка диалектов датасета и построено бинарное дерево близости, затем автор сравнил расстояние на этом дереве со своими результатами, полученными автоматически - но эта информация не вошла в доклад и была сообщена лишь как ответ на вопрос, тогда как именно это сравнение, на мой взгляд, и является ключевым результатом исследования. Также при анализе результатов работы использовалось предположение о тем большем различии диалектов, чем дальше друг от друга географически живут их носители - интуитивно понятно, но не слишком строго с точки зрения среднего слушателя-не диалектолога. Сами по себе i-векторы, получаемые из аудиозаписей с естественной речью, были очень кратко объяснены как концепт и им, на мой взгляд, было уделено недостаточное внимание в контексте доклада (для слушателей, ранее не знакомых с этим понятием). Автор строит i-векторы для 5 диалектов с помощью двух автоматических техник построения i-векторов, принципу работы которых также было уделено мало времени. Далее автор производит сравнение таблиц попарных расстояний между диалектами в различных метриках и оценивает осмысленность результатов по сравнению со своими представлении о правильных результатах, что, как указано выше, недостаточно строго. В целом, доклад недостаточно хорошо структурирован (мало внимания ключевым методам), а его результаты не обоснованы (сравнение с экспертными оценками не были приведены).
+
Доклад рассматривает применение i-векторов для определения близости языков для данных в виде аудиозаписей речи носителей языка. Автор собрал датасет записей пяти диалектов Латвии с целью проверить, насколько близость между i-векторами для этих диалектов отразит их «интуитивную» близость. Здесь встаёт вопрос о том, в каком именно смысле понимается здесь близость между языками/диалектами, и автор при ответе на этот вопрос после доклада сообщает, что имеет бэкграунд в диалектологии и для него похожесть или непохожесть диалектов является тривиальным свойством.  
 +
 
 +
Также была проведена экспертная оценка диалектов датасета и построено бинарное дерево близости, затем автор сравнил расстояние на этом дереве со своими результатами, полученными автоматически — но эта информация не вошла в доклад и была сообщена лишь как ответ на вопрос, тогда как именно это сравнение, на мой взгляд, и является ключевым результатом исследования. Также при анализе результатов работы использовалось предположение о тем большем различии диалектов, чем дальше друг от друга географически живут их носители — интуитивно понятно, но не слишком строго с точки зрения среднего слушателя-не диалектолога.  
 +
 
 +
Сами по себе i-векторы, получаемые из аудиозаписей с естественной речью, были очень кратко объяснены как концепт и им, на мой взгляд, было уделено недостаточное внимание в контексте доклада (для слушателей, ранее не знакомых с этим понятием). Автор строит i-векторы для 5 диалектов с помощью двух автоматических техник построения i-векторов, принципу работы которых также было уделено мало времени. Далее автор производит сравнение таблиц попарных расстояний между диалектами в различных метриках и оценивает осмысленность результатов по сравнению со своими представлении о правильных результатах, что, как указано выше, недостаточно строго. В целом, доклад недостаточно хорошо структурирован (мало внимания ключевым методам), а его результаты не обоснованы (результаты сравнения выхода автоматических методов с экспертными оценками не были приведены).

Текущая версия на 15:56, 8 декабря 2021

[1]

Отзыв: Применение i-векторов для автоматизированного определения уровня близости языков (Анс-Атаол Берзинь, ISPRASOPEN-2019)

Доклад рассматривает применение i-векторов для определения близости языков для данных в виде аудиозаписей речи носителей языка. Автор собрал датасет записей пяти диалектов Латвии с целью проверить, насколько близость между i-векторами для этих диалектов отразит их «интуитивную» близость. Здесь встаёт вопрос о том, в каком именно смысле понимается здесь близость между языками/диалектами, и автор при ответе на этот вопрос после доклада сообщает, что имеет бэкграунд в диалектологии и для него похожесть или непохожесть диалектов является тривиальным свойством.

Также была проведена экспертная оценка диалектов датасета и построено бинарное дерево близости, затем автор сравнил расстояние на этом дереве со своими результатами, полученными автоматически — но эта информация не вошла в доклад и была сообщена лишь как ответ на вопрос, тогда как именно это сравнение, на мой взгляд, и является ключевым результатом исследования. Также при анализе результатов работы использовалось предположение о тем большем различии диалектов, чем дальше друг от друга географически живут их носители — интуитивно понятно, но не слишком строго с точки зрения среднего слушателя-не диалектолога.

Сами по себе i-векторы, получаемые из аудиозаписей с естественной речью, были очень кратко объяснены как концепт и им, на мой взгляд, было уделено недостаточное внимание в контексте доклада (для слушателей, ранее не знакомых с этим понятием). Автор строит i-векторы для 5 диалектов с помощью двух автоматических техник построения i-векторов, принципу работы которых также было уделено мало времени. Далее автор производит сравнение таблиц попарных расстояний между диалектами в различных метриках и оценивает осмысленность результатов по сравнению со своими представлении о правильных результатах, что, как указано выше, недостаточно строго. В целом, доклад недостаточно хорошо структурирован (мало внимания ключевым методам), а его результаты не обоснованы (результаты сравнения выхода автоматических методов с экспертными оценками не были приведены).