<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">izvestswsu</journal-id><journal-title-group><journal-title xml:lang="ru">Известия Юго-Западного государственного университета</journal-title><trans-title-group xml:lang="en"><trans-title>Proceedings of the Southwest State University</trans-title></trans-title-group></journal-title-group><issn pub-type="ppub">2223-1560</issn><issn pub-type="epub">2686-6757</issn><publisher><publisher-name>ЮЗГУ</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.21869/2223-1560-2017-21-5-45-61</article-id><article-id custom-type="elpub" pub-id-type="custom">izvestswsu-243</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>Технические науки</subject></subj-group></article-categories><title-group><article-title>ИНФОЛОГИЧЕСКАЯ СИСТЕМА АНАЛИТИЧЕСКОГО МОНИТОРИНГА ДАННЫХ В НЕСТРУКТУРИРОВАННЫХ ИНФОРМАЦИОННЫХ РЕСУРСАХ</article-title><trans-title-group xml:lang="en"><trans-title>INFOLOGICAL MONITORING SYSTEM OF ANALYTICAL DATA UNSTRUCTURED CONTENT</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Михайлов</surname><given-names>С. Н.</given-names></name><name name-style="western" xml:lang="en"><surname>Mikhailov</surname><given-names>S. N.</given-names></name></name-alternatives><email xlink:type="simple">rio_kursk@mail.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Ключникова</surname><given-names>О. Е.</given-names></name><name name-style="western" xml:lang="en"><surname>Klyuchnikova</surname><given-names>О. Е.</given-names></name></name-alternatives><email xlink:type="simple">rio_kursk@mail.ru</email><xref ref-type="aff" rid="aff-1"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru"><institution>ФГБОУ ВО «Юго-Западный государственный университет»</institution></aff><aff xml:lang="en"><institution>Southwest State University</institution></aff></aff-alternatives><pub-date pub-type="collection"><year>2017</year></pub-date><pub-date pub-type="epub"><day>28</day><month>10</month><year>2017</year></pub-date><volume>21</volume><issue>5</issue><fpage>45</fpage><lpage>61</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Михайлов С.Н., Ключникова О.Е., 2017</copyright-statement><copyright-year>2017</copyright-year><copyright-holder xml:lang="ru">Михайлов С.Н., Ключникова О.Е.</copyright-holder><copyright-holder xml:lang="en">Mikhailov S.N., Klyuchnikova О.Е.</copyright-holder><license xml:lang="ru" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>Данная работа распространяется под лицензией Creative Commons Attribution 4.0.</license-p></license><license xml:lang="en" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>This work is licensed under a Creative Commons Attribution 4.0 License.</license-p></license></permissions><self-uri xlink:href="https://izvestswsu.elpub.ru/jour/article/view/243">https://izvestswsu.elpub.ru/jour/article/view/243</self-uri><abstract><p>В работе предлагается вариант решения проблемы оперативного поиска информации в неструкту-рированных информационных ресурсах. Построены и описаны четыре основных блока, реализующих поиск информации по смысловым значениям. В статье предлагается алгоритм решения задачи оценки соответ-ствия смыслового содержания текстовых документов заданной предметной области. Предложенный инфологический подход выполнен на основе анализа данных патентного поиска, опубликованных научных работ и проведенных экспериментальных исследований эффективных методов автоматической оценки содержания неструктурированных информационных ресурсов для организации процессов информационно-аналитического обеспечения научной деятельности. В работе предложен способ оценки и сопоставления тематической направленности данных в не-структурированных информационных ресурсах, на основе применении инфологической системы. Данный способ предполагает проведение кластеризации текстовых документов путем сравнения семантическо-го содержания исследуемого текста и антологии. Описана структура поисковой подсистемы, имеющей сервисно-ориентированную клиент-серверную архитектуру с тонким клиентом (веб-обозреватель). Опи-санный метод был апробирован на наборе текстов, полученных в результате мониторинга открытых публичных инфокоммуникационных Интернет-ресурсов без ограничения темы (получено и обработано более 1 млн. экземпляров текстов). Среди полученных текстов экспертным путем была сформирована обучающая выборка для следующих типов текстов: художественные тексты, научные технические статьи, автоматически сгенерированные псевдонаучные тексты, полученные в результате работы систем, спам-содержащие тексты. Предложен состав и описана общая архитектура программного обеспечения инфологической системы, основные компоненты системы являются кросс-платформенными. На основе результатов экспериментальных исследований показана принципиальная возможность реализации автоматизирован-ной оценки тематического подобия документов на примере инфологической обработки текстов рабочих программ дисциплин, сформированы требования, предъявляемые к программному интерфейсу взаимодей-ствия макета с внешними поисковыми системами.</p></abstract><trans-abstract xml:lang="en"><p>In operation the way of solving the problem of quick search of information in unstructured information resources is offered. Four main units realizing information search in semantic values are constructed and described. In article the algorithm of the decision of the task of assessment of compliance of semantic contents of text documents of the given data domain is offered. The offered infologichesky approach is executed on the basis of data analysis of patent search, the published scientific operations and the conducted pilot studies of effective methods of automatic assessment of maintenance of unstructured information resources for the organization of processes of information and analytical support of scientific activities. In operation the method of assessment and comparison of a subject directivity of data in unstructured information resources, on a basis use of infologichesky system is offered. This method assumes carrying out a clustering of text documents by comparing of semantic contents of the researched text and the anthology. The structure of the retrieval subsystem having the service-oriented client-server architecture with the thin client (web observer) is described. The described method was approved on a set of the texts received as a result of monitoring of open public infocommunication Internet resources without restriction of a subject (more than 1 million copies of texts are received and processed). Among the received texts by an expert way learning selection for the following types of texts was created: artistic texts, scientific technical articles, the pseudoscientific texts received as a result of operation of systems, a spam automatically generated - the containing texts. The composition is offered and the general architecture of the software of infologichesky system is described, principal components of system are cross-platform. On the basis of results of the pilot studies the basic possibility of implementation of automated assessment of subject similarity of documents on the example of infologichesky processing of texts of working programs of disciplines is shown, requirements imposed to the program interface of interaction of a prototype with external search engines are created.Key words: infological system, assessment of the thematic similarity, information resource working program of discipline, competence, semantic analysis, meaning.</p></trans-abstract><kwd-group xml:lang="ru"><kwd>инфологическая система</kwd><kwd>оценка тематического подобия</kwd><kwd>информационный ресурс</kwd><kwd>рабочая программа дисциплины</kwd><kwd>компетенция</kwd><kwd>семантический анализ</kwd><kwd>смысловое значение</kwd></kwd-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Михайлов С.Н. Способ тематической кластеризации текстовых документов на основе их инфологической обработки // Наукоемкие технологии. 2012. Т. 13, № 9. С. 48-51.</mixed-citation><mixed-citation xml:lang="en">Михайлов С.Н. Способ тематической кластеризации текстовых документов на основе их инфологической обработки // Наукоемкие технологии. 2012. Т. 13, № 9. С. 48-51.</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Кулешов С.В., Михайлов С.Н. Вариант архитектуры субпоисковой системы для реализации функции аналитического мониторинга // Труды СПИИРАН. 2013. № 8 (31). С. 247-254</mixed-citation><mixed-citation xml:lang="en">Кулешов С.В., Михайлов С.Н. Вариант архитектуры субпоисковой системы для реализации функции аналитического мониторинга // Труды СПИИРАН. 2013. № 8 (31). С. 247-254</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Зайцева А.А., Кулешов С.В., Михайлов С.Н. Метод оценки качества тек-стов в задачах аналитического мониторинга информационных ресурсов// Труды СПИИРАН. 2014. № 6. С. 144-155.</mixed-citation><mixed-citation xml:lang="en">Зайцева А.А., Кулешов С.В., Михайлов С.Н. Метод оценки качества тек-стов в задачах аналитического мониторинга информационных ресурсов// Труды СПИИРАН. 2014. № 6. С. 144-155.</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Михайлов С.Н., Кулешов С.В. Экспертный мониторинг неструктурированных информационных ресурсов в интересах информационно-аналитического обеспечения космических исследований// Известия Юго-Западного государственного университета. 2013. № 6-2 (51). С. 40-43.</mixed-citation><mixed-citation xml:lang="en">Михайлов С.Н., Кулешов С.В. Экспертный мониторинг неструктурированных информационных ресурсов в интересах информационно-аналитического обеспечения космических исследований// Известия Юго-Западного государственного университета. 2013. № 6-2 (51). С. 40-43.</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Михайлов С.Н., Агапченко К.И. Способ инфологической обработки рабочих программ дисциплин для оценки подобия тематического содержания лекционных курсов // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы I Всероссийской научно-практической конференции. Курск, 2014. С. 128-136.</mixed-citation><mixed-citation xml:lang="en">Михайлов С.Н., Агапченко К.И. Способ инфологической обработки рабочих программ дисциплин для оценки подобия тематического содержания лекционных курсов // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы I Всероссийской научно-практической конференции. Курск, 2014. С. 128-136.</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Михайлов С.Н., Чуйкова В.В. Способ оценки содержания дисциплин отдельного направления подготовки требуемым компетенциям // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2014. № 3. С. 19-24.</mixed-citation><mixed-citation xml:lang="en">Михайлов С.Н., Чуйкова В.В. Способ оценки содержания дисциплин отдельного направления подготовки требуемым компетенциям // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2014. № 3. С. 19-24.</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Михайлов С.Н., Хотынюк С.С., Потапенко А.М. Технологии интерактивного выявления смыслового содержания текстов в целях организации информационно-аналитического обеспечения научных исследований // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2013. № 4. С. 29-34.</mixed-citation><mixed-citation xml:lang="en">Михайлов С.Н., Хотынюк С.С., Потапенко А.М. Технологии интерактивного выявления смыслового содержания текстов в целях организации информационно-аналитического обеспечения научных исследований // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2013. № 4. С. 29-34.</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Михайлов С.Н., Тезик К.А. Вариант программной реализации способа тематической кластеризации текстовых документов на основе использования макросов VBA и EXCEL // Известия Юго-Западного государственного университета. 2012. № 4 (43), ч.2. С. 17-21.</mixed-citation><mixed-citation xml:lang="en">Михайлов С.Н., Тезик К.А. Вариант программной реализации способа тематической кластеризации текстовых документов на основе использования макросов VBA и EXCEL // Известия Юго-Западного государственного университета. 2012. № 4 (43), ч.2. С. 17-21.</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Михайлов С.Н., Севрюков А.Е. Обобщенная архитектура инфокоммуникационной среды информационно-ана-литического обеспечения научных исследований вуза // Информационно-измери-тельные и управляющие системы. 2010. Т. 8, № 11. С. 40-42.</mixed-citation><mixed-citation xml:lang="en">Михайлов С.Н., Севрюков А.Е. Обобщенная архитектура инфокоммуникационной среды информационно-ана-литического обеспечения научных исследований вуза // Информационно-измери-тельные и управляющие системы. 2010. Т. 8, № 11. С. 40-42.</mixed-citation></citation-alternatives></ref><ref id="cit10"><label>10</label><citation-alternatives><mixed-citation xml:lang="ru">Марухленко А.Л., Конарев Д.И., Якушев А.С. Сравнение текстов на основе анализа и сопоставления их смысловых значений // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической конференции. Курск, 2015. C.168-171.</mixed-citation><mixed-citation xml:lang="en">Марухленко А.Л., Конарев Д.И., Якушев А.С. Сравнение текстов на основе анализа и сопоставления их смысловых значений // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической конференции. Курск, 2015. C.168-171.</mixed-citation></citation-alternatives></ref><ref id="cit11"><label>11</label><citation-alternatives><mixed-citation xml:lang="ru">Марухленко А.Л., Коршунов Е.Е., Якушев А.С. Вариант нормализации первичных данных с учетом семантической составляющей // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической конференции. Курск, 2015. C.171-176.</mixed-citation><mixed-citation xml:lang="en">Марухленко А.Л., Коршунов Е.Е., Якушев А.С. Вариант нормализации первичных данных с учетом семантической составляющей // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической конференции. Курск, 2015. C.171-176.</mixed-citation></citation-alternatives></ref><ref id="cit12"><label>12</label><citation-alternatives><mixed-citation xml:lang="ru">Потапенко А.М., Юрченко А.Г., Попадинец Р.В. Семиотическая модель языка // Нейрокомпьютеры: разработка, применение. 2014. № 6. С. 34-41</mixed-citation><mixed-citation xml:lang="en">Потапенко А.М., Юрченко А.Г., Попадинец Р.В. Семиотическая модель языка // Нейрокомпьютеры: разработка, применение. 2014. № 6. С. 34-41</mixed-citation></citation-alternatives></ref><ref id="cit13"><label>13</label><citation-alternatives><mixed-citation xml:lang="ru">Исследование и разработка научно-технических путей создания информационно-телекоммуникационной системы аналитического мониторинга в неструктурированных информационных ресурсах: отчет о НИР / Юго-Зап. гос. ун-т (ЮЗГУ); рук. М.В. Соколова. Курск, 2015. 293 с. № 2.2491.2014/К.</mixed-citation><mixed-citation xml:lang="en">Исследование и разработка научно-технических путей создания информационно-телекоммуникационной системы аналитического мониторинга в неструктурированных информационных ресурсах: отчет о НИР / Юго-Зап. гос. ун-т (ЮЗГУ); рук. М.В. Соколова. Курск, 2015. 293 с. № 2.2491.2014/К.</mixed-citation></citation-alternatives></ref><ref id="cit14"><label>14</label><citation-alternatives><mixed-citation xml:lang="ru">Тезик К.А., Михайлов С.Н. Методика планирования эксперимента в целях распознавания тематической направленности информационных ресурсов сети интернет // Инфокоммуникации и ин-формационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической кон-ференции. Курск, 2015. С.72-79.</mixed-citation><mixed-citation xml:lang="en">Тезик К.А., Михайлов С.Н. Методика планирования эксперимента в целях распознавания тематической направленности информационных ресурсов сети интернет // Инфокоммуникации и ин-формационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической кон-ференции. Курск, 2015. С.72-79.</mixed-citation></citation-alternatives></ref><ref id="cit15"><label>15</label><citation-alternatives><mixed-citation xml:lang="ru">Классификация форматов файлов для задач селекции документов / А.С. Якушев [и др.] // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы I Всероссийской научно-практической конференции. Курск, 2014. С. 289-293.</mixed-citation><mixed-citation xml:lang="en">Классификация форматов файлов для задач селекции документов / А.С. Якушев [и др.] // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы I Всероссийской научно-практической конференции. Курск, 2014. С. 289-293.</mixed-citation></citation-alternatives></ref><ref id="cit16"><label>16</label><citation-alternatives><mixed-citation xml:lang="ru">Потапенко А.М., Русанов Р.Н. Проблема информационного поиска по содержанию // Известия Юго-Западного государственного университета. Серия Управление, вычислительная техника, информатика. Медицинское приборостроение. 2012. № 2, ч.3. С. 100-102.</mixed-citation><mixed-citation xml:lang="en">Потапенко А.М., Русанов Р.Н. Проблема информационного поиска по содержанию // Известия Юго-Западного государственного университета. Серия Управление, вычислительная техника, информатика. Медицинское приборостроение. 2012. № 2, ч.3. С. 100-102.</mixed-citation></citation-alternatives></ref><ref id="cit17"><label>17</label><citation-alternatives><mixed-citation xml:lang="ru">Потапенко А.М., Юрченко А.Г. Схема образования языковых знаков в естественно-языковых текстах // Нейро-компьютеры: разработка, применение. 2014. № 6. С. 41-44.</mixed-citation><mixed-citation xml:lang="en">Потапенко А.М., Юрченко А.Г. Схема образования языковых знаков в естественно-языковых текстах // Нейро-компьютеры: разработка, применение. 2014. № 6. С. 41-44.</mixed-citation></citation-alternatives></ref><ref id="cit18"><label>18</label><citation-alternatives><mixed-citation xml:lang="ru">Персонализированная система поиска информации с функцией определения тематики и анализа смысловых значений / А.М. Потапенко, А.Л. Марухленко, Д.И. Конарев, А.С. Якушев // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической конференции. Курск, 2015. С. 181-187.</mixed-citation><mixed-citation xml:lang="en">Персонализированная система поиска информации с функцией определения тематики и анализа смысловых значений / А.М. Потапенко, А.Л. Марухленко, Д.И. Конарев, А.С. Якушев // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической конференции. Курск, 2015. С. 181-187.</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
