<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
		<id>https://discopal.ispras.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA%3ABoeing%2F%D0%A0%D0%B5%D1%86%D0%B5%D0%BD%D0%B7%D0%B8%D1%8F%3A%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2</id>
		<title>Участник:Boeing/Рецензия:Бенчмаркинг коллекций научных журналов - История изменений</title>
		<link rel="self" type="application/atom+xml" href="https://discopal.ispras.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA%3ABoeing%2F%D0%A0%D0%B5%D1%86%D0%B5%D0%BD%D0%B7%D0%B8%D1%8F%3A%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2"/>
		<link rel="alternate" type="text/html" href="https://discopal.ispras.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Boeing/%D0%A0%D0%B5%D1%86%D0%B5%D0%BD%D0%B7%D0%B8%D1%8F:%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2&amp;action=history"/>
		<updated>2026-05-07T05:22:58Z</updated>
		<subtitle>История изменений этой страницы в вики</subtitle>
		<generator>MediaWiki 1.26.4</generator>

	<entry>
		<id>https://discopal.ispras.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Boeing/%D0%A0%D0%B5%D1%86%D0%B5%D0%BD%D0%B7%D0%B8%D1%8F:%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2&amp;diff=19686&amp;oldid=prev</id>
		<title>StasFomin в 15:47, 8 декабря 2021</title>
		<link rel="alternate" type="text/html" href="https://discopal.ispras.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Boeing/%D0%A0%D0%B5%D1%86%D0%B5%D0%BD%D0%B7%D0%B8%D1%8F:%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2&amp;diff=19686&amp;oldid=prev"/>
				<updated>2021-12-08T15:47:45Z</updated>
		
		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table class='diff diff-contentalign-left'&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;tr style='vertical-align: top;' lang='ru'&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;← Предыдущая&lt;/td&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;Версия 15:47, 8 декабря 2021&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l1&quot; &gt;Строка 1:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Строка 1:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[https://0x1.tv/%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2_(%D0%A4%D0%B5%D0%B4%D0%BE%D1%80_%D0%9A%D1%80%D0%B0%D1%81%D0%BD%D0%BE%D0%B2,_SECR-2019)]&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[https://0x1.tv/%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2_(%D0%A4%D0%B5%D0%B4%D0%BE%D1%80_%D0%9A%D1%80%D0%B0%D1%81%D0%BD%D0%BE%D0%B2,_SECR-2019)]&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;== Краткий отзыв на доклад &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;Бенчмаркинг &lt;/del&gt;коллекций научных журналов (Федор Краснов, SECR-2019) ==&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;== Краткий отзыв на доклад &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;«Бенчмаркинг &lt;/ins&gt;коллекций научных журналов (Федор Краснов, SECR-2019)&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;» &lt;/ins&gt;==&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Доклад описывает опыт создания сервиса анализа текстов для решения конкретной бизнес проблемы. Доклад больше фокусируется именно на процессе разработки, чем на научной составляющей, что, на мой взгляд, ценно, поскольку докладов и статей именно на прикладном уровне сильно меньше, чем собственно научных статей. Авторы поставили перед собой задачу разработки системы тематического анализа коллекций статей для качественного и количественного сравнения между собой двух коллекций научных статей: &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;одну - целевую - &lt;/del&gt;коллекцию статей индексируемого журнала, и &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;вторую - &lt;/del&gt;коллекцию статей неиндексируемого журнала-заказчика с целью объяснить второму, что он делает не так&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;. Видимо, все журналы публикуются на английском языке, то есть, мы находимся в одном языковом домене&lt;/del&gt;.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Доклад описывает опыт создания сервиса анализа текстов для решения конкретной бизнес проблемы. Доклад больше фокусируется именно на процессе разработки, чем на научной составляющей, что, на мой взгляд, ценно, поскольку докладов и статей именно на прикладном уровне сильно меньше, чем собственно научных статей. Авторы поставили перед собой задачу разработки системы тематического анализа коллекций статей для качественного и количественного сравнения между собой двух коллекций научных статей: &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;одну — целевую — &lt;/ins&gt;коллекцию статей индексируемого журнала, и &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;вторую — &lt;/ins&gt;коллекцию статей неиндексируемого журнала-заказчика с целью объяснить второму, что он делает не так. &amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;В качестве основы использовался подход Comparative Text Mining&lt;/del&gt;, &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;при котором &lt;/del&gt;на &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;сумме коллекций текста выполняется мягкая кластеризация - суть выделение тематик&lt;/del&gt;, &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;а далее - еще одна кластеризация тематик между двумя коллекциями. Для мягкой кластеризации была подобрана специфическая тематическая модель&lt;/del&gt;, &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;которая хорошо показала себя на абстрактах статей (длина текста здесь существенна для результатов тематического моделирования). В результирующих токенах-тематиках была проведена фильтрация по частям речи - оставлены только существительные&lt;/del&gt;.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;Видимо&lt;/ins&gt;, &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;все журналы публикуются &lt;/ins&gt;на &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;английском языке&lt;/ins&gt;, &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;то есть&lt;/ins&gt;, &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;мы находимся в одном языковом домене&lt;/ins&gt;.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Автор отмечает, что в сервисе использовались исключительно готовые фреймворки, и необходимым навыком программистов здесь являлось умение подобрать нужный фреймворк (например, было перепробовано порядка 50 тематических моделей), а не изобретать велосипед. Фундаментальное понимание работы моделей необходимо, но важнее уметь применять модели к нестандартным ситуациям. Была сделана ремарка касательно непригодности студентов для работы над подобными &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;проектами - &lt;/del&gt;в этой части самолюбие несколько задето, но &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;согласен - &lt;/del&gt;нужно действительно уметь делать конкретные вещи. В команде присутствовали специалисты различных областей (например, врач), что было необходимо для правильной интерпретации результатов системы. Сбор данных с помощью автоматических краулеров описан как несложная задача, в отличие от подбора &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;гиперпараметров - &lt;/del&gt;здесь авторы нашли какое-то элегантное решение на основе минимизации энтропии (оставлен за рамками доклада, описан в статье). Отмечается что добавление даже одного нового гиперпараметра в систему приводит к необходимости подвергнуть переоценке уже найденные оптимальные значения всех прочих гиперпараметров. Наверное, полезно заранее продумать структуру пространства гиперпараметров, чтобы по возможности не решать эту проблему по много раз (неградиентная оптимизация гиперпараметров требует много вычислительного времени).&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;В качестве основы использовался подход ''Comparative Text Mining'', при котором на сумме коллекций текста выполняется мягкая кластеризация — суть выделение тематик, а далее — еще одна кластеризация тематик между двумя коллекциями. Для мягкой кластеризации была подобрана специфическая тематическая модель, которая хорошо показала себя на абстрактах статей (длина текста здесь существенна для результатов тематического моделирования). В результирующих токенах-тематиках была проведена фильтрация по частям речи — оставлены только существительные.&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Автор отмечает, что в сервисе использовались исключительно готовые фреймворки, и необходимым навыком программистов здесь являлось умение подобрать нужный фреймворк (например, было перепробовано порядка 50 тематических моделей), а не изобретать велосипед. Фундаментальное понимание работы моделей необходимо, но важнее уметь применять модели к нестандартным ситуациям. &amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Была сделана ремарка касательно непригодности студентов для работы над подобными &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;проектами — &lt;/ins&gt;в этой части самолюбие несколько задето, но &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;согласен — &lt;/ins&gt;нужно действительно уметь делать конкретные вещи. В команде присутствовали специалисты различных областей (например, врач), что было необходимо для правильной интерпретации результатов системы. Сбор данных с помощью автоматических краулеров описан как несложная задача, в отличие от подбора &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;гиперпараметров — &lt;/ins&gt;здесь авторы нашли какое-то элегантное решение на основе минимизации энтропии (оставлен за рамками доклада, описан в статье). &amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Отмечается что добавление даже одного нового гиперпараметра в систему приводит к необходимости подвергнуть переоценке уже найденные оптимальные значения всех прочих гиперпараметров. Наверное, полезно заранее продумать структуру пространства гиперпараметров, чтобы по возможности не решать эту проблему по много раз (неградиентная оптимизация гиперпараметров требует много вычислительного времени).&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;В целом доклад хорошо структурирован, содержит полезные советы и соображения касательно приложения научных результатов к реальному миру для решения бизнес-задач и заставил меня задуматься о том, что хорошо бы и мне научиться делать что-то реальное. Но наверное, это уже после диплома :)&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;В целом доклад хорошо структурирован, содержит полезные советы и соображения касательно приложения научных результатов к реальному миру для решения бизнес-задач и заставил меня задуматься о том, что хорошо бы и мне научиться делать что-то реальное. Но наверное, это уже после диплома :)&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;

&lt;!-- diff cache key discopal:diff:version:1.11a:oldid:18914:newid:19686 --&gt;
&lt;/table&gt;</summary>
		<author><name>StasFomin</name></author>	</entry>

	<entry>
		<id>https://discopal.ispras.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Boeing/%D0%A0%D0%B5%D1%86%D0%B5%D0%BD%D0%B7%D0%B8%D1%8F:%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2&amp;diff=18914&amp;oldid=prev</id>
		<title>Boeing: /* Краткий отзыв на доклад Бенчмаркинг коллекций научных журналов (Федор Краснов, SECR-2019) */</title>
		<link rel="alternate" type="text/html" href="https://discopal.ispras.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Boeing/%D0%A0%D0%B5%D1%86%D0%B5%D0%BD%D0%B7%D0%B8%D1%8F:%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2&amp;diff=18914&amp;oldid=prev"/>
				<updated>2021-11-10T20:35:35Z</updated>
		
		<summary type="html">&lt;p&gt;‎&lt;span dir=&quot;auto&quot;&gt;&lt;span class=&quot;autocomment&quot;&gt;Краткий отзыв на доклад Бенчмаркинг коллекций научных журналов (Федор Краснов, SECR-2019)&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;
&lt;table class='diff diff-contentalign-left'&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;tr style='vertical-align: top;' lang='ru'&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;← Предыдущая&lt;/td&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;Версия 20:35, 10 ноября 2021&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l7&quot; &gt;Строка 7:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Строка 7:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;В качестве основы использовался подход Comparative Text Mining, при котором на сумме коллекций текста выполняется мягкая кластеризация - суть выделение тематик, а далее - еще одна кластеризация тематик между двумя коллекциями. Для мягкой кластеризации была подобрана специфическая тематическая модель, которая хорошо показала себя на абстрактах статей (длина текста здесь существенна для результатов тематического моделирования). В результирующих токенах-тематиках была проведена фильтрация по частям речи - оставлены только существительные.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;В качестве основы использовался подход Comparative Text Mining, при котором на сумме коллекций текста выполняется мягкая кластеризация - суть выделение тематик, а далее - еще одна кластеризация тематик между двумя коллекциями. Для мягкой кластеризации была подобрана специфическая тематическая модель, которая хорошо показала себя на абстрактах статей (длина текста здесь существенна для результатов тематического моделирования). В результирующих токенах-тематиках была проведена фильтрация по частям речи - оставлены только существительные.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Автор отмечает, что в сервисе использовались исключительно готовые фреймворки, и необходимым навыком программистов здесь являлось умение подобрать нужный фреймворк (например, было перепробовано порядка 50 тематических моделей), а не изобретать велосипед. Фундаментальное понимание работы моделей необходимо, но важнее уметь применять модели к нестандартным ситуациям. Была сделана ремарка касательно непригодности студентов для работы над подобными проектами - в этой части самолюбие несколько задето, но согласен - нужно действительно уметь делать конкретные вещи. В команде присутствовали специалисты различных областей (например, врач), что было необходимо для правильной интерпретации результатов системы. Сбор данных с помощью автоматических краулеров описан как несложная задача, в отличие от подбора гиперпараметров - здесь авторы нашли какое-то элегантное решение на основе минимизации энтропии. Отмечается что добавление даже одного нового гиперпараметра в систему приводит к необходимости подвергнуть переоценке уже найденные оптимальные значения всех прочих гиперпараметров. Наверное, полезно заранее продумать структуру пространства гиперпараметров, чтобы по возможности не решать эту проблему по много раз (неградиентная оптимизация гиперпараметров требует много вычислительного времени).&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Автор отмечает, что в сервисе использовались исключительно готовые фреймворки, и необходимым навыком программистов здесь являлось умение подобрать нужный фреймворк (например, было перепробовано порядка 50 тематических моделей), а не изобретать велосипед. Фундаментальное понимание работы моделей необходимо, но важнее уметь применять модели к нестандартным ситуациям. Была сделана ремарка касательно непригодности студентов для работы над подобными проектами - в этой части самолюбие несколько задето, но согласен - нужно действительно уметь делать конкретные вещи. В команде присутствовали специалисты различных областей (например, врач), что было необходимо для правильной интерпретации результатов системы. Сбор данных с помощью автоматических краулеров описан как несложная задача, в отличие от подбора гиперпараметров - здесь авторы нашли какое-то элегантное решение на основе минимизации энтропии &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;(оставлен за рамками доклада, описан в статье)&lt;/ins&gt;. Отмечается что добавление даже одного нового гиперпараметра в систему приводит к необходимости подвергнуть переоценке уже найденные оптимальные значения всех прочих гиперпараметров. Наверное, полезно заранее продумать структуру пространства гиперпараметров, чтобы по возможности не решать эту проблему по много раз (неградиентная оптимизация гиперпараметров требует много вычислительного времени).&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;В целом доклад хорошо структурирован, содержит полезные советы и соображения касательно приложения научных результатов к реальному миру для решения бизнес-задач и заставил меня задуматься о том, что хорошо бы и мне научиться делать что-то реальное. Но наверное, это уже после диплома :)&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;В целом доклад хорошо структурирован, содержит полезные советы и соображения касательно приложения научных результатов к реальному миру для решения бизнес-задач и заставил меня задуматься о том, что хорошо бы и мне научиться делать что-то реальное. Но наверное, это уже после диплома :)&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;

&lt;!-- diff cache key discopal:diff:version:1.11a:oldid:18913:newid:18914 --&gt;
&lt;/table&gt;</summary>
		<author><name>Boeing</name></author>	</entry>

	<entry>
		<id>https://discopal.ispras.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Boeing/%D0%A0%D0%B5%D1%86%D0%B5%D0%BD%D0%B7%D0%B8%D1%8F:%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2&amp;diff=18913&amp;oldid=prev</id>
		<title>Boeing: /* Краткий отзыв на доклад Бенчмаркинг коллекций научных журналов (Федор Краснов, SECR-2019) */</title>
		<link rel="alternate" type="text/html" href="https://discopal.ispras.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Boeing/%D0%A0%D0%B5%D1%86%D0%B5%D0%BD%D0%B7%D0%B8%D1%8F:%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2&amp;diff=18913&amp;oldid=prev"/>
				<updated>2021-11-10T20:34:56Z</updated>
		
		<summary type="html">&lt;p&gt;‎&lt;span dir=&quot;auto&quot;&gt;&lt;span class=&quot;autocomment&quot;&gt;Краткий отзыв на доклад Бенчмаркинг коллекций научных журналов (Федор Краснов, SECR-2019)&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;
&lt;table class='diff diff-contentalign-left'&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;tr style='vertical-align: top;' lang='ru'&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;← Предыдущая&lt;/td&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;Версия 20:34, 10 ноября 2021&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l7&quot; &gt;Строка 7:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Строка 7:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;В качестве основы использовался подход Comparative Text Mining, при котором на сумме коллекций текста выполняется мягкая кластеризация - суть выделение тематик, а далее - еще одна кластеризация тематик между двумя коллекциями. Для мягкой кластеризации была подобрана специфическая тематическая модель, которая хорошо показала себя на абстрактах статей (длина текста здесь существенна для результатов тематического моделирования). В результирующих токенах-тематиках была проведена фильтрация по частям речи - оставлены только существительные.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;В качестве основы использовался подход Comparative Text Mining, при котором на сумме коллекций текста выполняется мягкая кластеризация - суть выделение тематик, а далее - еще одна кластеризация тематик между двумя коллекциями. Для мягкой кластеризации была подобрана специфическая тематическая модель, которая хорошо показала себя на абстрактах статей (длина текста здесь существенна для результатов тематического моделирования). В результирующих токенах-тематиках была проведена фильтрация по частям речи - оставлены только существительные.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Автор отмечает, что в сервисе использовались исключительно готовые фреймворки, и необходимым навыком программистов здесь являлось умение подобрать нужный фреймворк (например, было перепробовано порядка 50 тематических моделей), а не изобретать велосипед. Фундаментальное понимание работы моделей необходимо, но важнее уметь применять модели к нестандартным ситуациям. Была сделана ремарка касательно непригодности студентов для работы над подобными проектами - в этой части самолюбие несколько задето, но согласен - нужно действительно уметь делать конкретные вещи. В команде присутствовали специалисты различных областей (например, врач), что было &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;чрезвычайно полезно &lt;/del&gt;для интерпретации результатов системы. Сбор данных с помощью автоматических краулеров описан как несложная задача, в отличие от подбора гиперпараметров - здесь авторы нашли какое-то элегантное решение на основе минимизации энтропии. Отмечается что добавление даже одного нового гиперпараметра в систему приводит к необходимости подвергнуть переоценке уже найденные оптимальные значения всех прочих гиперпараметров. Наверное, полезно заранее продумать структуру пространства гиперпараметров, чтобы по возможности не решать эту проблему по много раз (неградиентная оптимизация гиперпараметров требует много вычислительного времени).&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Автор отмечает, что в сервисе использовались исключительно готовые фреймворки, и необходимым навыком программистов здесь являлось умение подобрать нужный фреймворк (например, было перепробовано порядка 50 тематических моделей), а не изобретать велосипед. Фундаментальное понимание работы моделей необходимо, но важнее уметь применять модели к нестандартным ситуациям. Была сделана ремарка касательно непригодности студентов для работы над подобными проектами - в этой части самолюбие несколько задето, но согласен - нужно действительно уметь делать конкретные вещи. В команде присутствовали специалисты различных областей (например, врач), что было &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;необходимо &lt;/ins&gt;для &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;правильной &lt;/ins&gt;интерпретации результатов системы. Сбор данных с помощью автоматических краулеров описан как несложная задача, в отличие от подбора гиперпараметров - здесь авторы нашли какое-то элегантное решение на основе минимизации энтропии. Отмечается что добавление даже одного нового гиперпараметра в систему приводит к необходимости подвергнуть переоценке уже найденные оптимальные значения всех прочих гиперпараметров. Наверное, полезно заранее продумать структуру пространства гиперпараметров, чтобы по возможности не решать эту проблему по много раз (неградиентная оптимизация гиперпараметров требует много вычислительного времени).&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;В целом доклад хорошо структурирован, содержит полезные советы и соображения касательно приложения научных результатов к реальному миру для решения бизнес-задач и заставил меня задуматься о том, что хорошо бы и мне научиться делать что-то реальное. Но наверное, это уже после диплома :)&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;В целом доклад хорошо структурирован, содержит полезные советы и соображения касательно приложения научных результатов к реальному миру для решения бизнес-задач и заставил меня задуматься о том, что хорошо бы и мне научиться делать что-то реальное. Но наверное, это уже после диплома :)&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;

&lt;!-- diff cache key discopal:diff:version:1.11a:oldid:18912:newid:18913 --&gt;
&lt;/table&gt;</summary>
		<author><name>Boeing</name></author>	</entry>

	<entry>
		<id>https://discopal.ispras.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Boeing/%D0%A0%D0%B5%D1%86%D0%B5%D0%BD%D0%B7%D0%B8%D1%8F:%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2&amp;diff=18912&amp;oldid=prev</id>
		<title>Boeing: Новая страница: «[https://0x1.tv/%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87…»</title>
		<link rel="alternate" type="text/html" href="https://discopal.ispras.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Boeing/%D0%A0%D0%B5%D1%86%D0%B5%D0%BD%D0%B7%D0%B8%D1%8F:%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2&amp;diff=18912&amp;oldid=prev"/>
				<updated>2021-11-10T20:32:42Z</updated>
		
		<summary type="html">&lt;p&gt;Новая страница: «[https://0x1.tv/%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87…»&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;[https://0x1.tv/%D0%91%D0%B5%D0%BD%D1%87%D0%BC%D0%B0%D1%80%D0%BA%D0%B8%D0%BD%D0%B3_%D0%BA%D0%BE%D0%BB%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2_(%D0%A4%D0%B5%D0%B4%D0%BE%D1%80_%D0%9A%D1%80%D0%B0%D1%81%D0%BD%D0%BE%D0%B2,_SECR-2019)]&lt;br /&gt;
&lt;br /&gt;
== Краткий отзыв на доклад Бенчмаркинг коллекций научных журналов (Федор Краснов, SECR-2019) ==&lt;br /&gt;
&lt;br /&gt;
Доклад описывает опыт создания сервиса анализа текстов для решения конкретной бизнес проблемы. Доклад больше фокусируется именно на процессе разработки, чем на научной составляющей, что, на мой взгляд, ценно, поскольку докладов и статей именно на прикладном уровне сильно меньше, чем собственно научных статей. Авторы поставили перед собой задачу разработки системы тематического анализа коллекций статей для качественного и количественного сравнения между собой двух коллекций научных статей: одну - целевую - коллекцию статей индексируемого журнала, и вторую - коллекцию статей неиндексируемого журнала-заказчика с целью объяснить второму, что он делает не так. Видимо, все журналы публикуются на английском языке, то есть, мы находимся в одном языковом домене.&lt;br /&gt;
&lt;br /&gt;
В качестве основы использовался подход Comparative Text Mining, при котором на сумме коллекций текста выполняется мягкая кластеризация - суть выделение тематик, а далее - еще одна кластеризация тематик между двумя коллекциями. Для мягкой кластеризации была подобрана специфическая тематическая модель, которая хорошо показала себя на абстрактах статей (длина текста здесь существенна для результатов тематического моделирования). В результирующих токенах-тематиках была проведена фильтрация по частям речи - оставлены только существительные.&lt;br /&gt;
&lt;br /&gt;
Автор отмечает, что в сервисе использовались исключительно готовые фреймворки, и необходимым навыком программистов здесь являлось умение подобрать нужный фреймворк (например, было перепробовано порядка 50 тематических моделей), а не изобретать велосипед. Фундаментальное понимание работы моделей необходимо, но важнее уметь применять модели к нестандартным ситуациям. Была сделана ремарка касательно непригодности студентов для работы над подобными проектами - в этой части самолюбие несколько задето, но согласен - нужно действительно уметь делать конкретные вещи. В команде присутствовали специалисты различных областей (например, врач), что было чрезвычайно полезно для интерпретации результатов системы. Сбор данных с помощью автоматических краулеров описан как несложная задача, в отличие от подбора гиперпараметров - здесь авторы нашли какое-то элегантное решение на основе минимизации энтропии. Отмечается что добавление даже одного нового гиперпараметра в систему приводит к необходимости подвергнуть переоценке уже найденные оптимальные значения всех прочих гиперпараметров. Наверное, полезно заранее продумать структуру пространства гиперпараметров, чтобы по возможности не решать эту проблему по много раз (неградиентная оптимизация гиперпараметров требует много вычислительного времени).&lt;br /&gt;
&lt;br /&gt;
В целом доклад хорошо структурирован, содержит полезные советы и соображения касательно приложения научных результатов к реальному миру для решения бизнес-задач и заставил меня задуматься о том, что хорошо бы и мне научиться делать что-то реальное. Но наверное, это уже после диплома :)&lt;/div&gt;</summary>
		<author><name>Boeing</name></author>	</entry>

	</feed>