Российско-тайваньский проект № 17-57-52011 «Исследование и разработка системы человеко-машинного взаимодействия для виртуального окружения на основе группы экранов и датчиков глубины». Руководитель проекта Чувилин К.В.
Данный проект направлен на развитие технологий виртуального окружения, методов и алгоритмов визуализации и человеко-машинного взаимодействия и их приложений для решения широкого класса сложных задач фундаментальной науки, решаемых с помощью человеко-машинных комплексов. Ранее нашим коллективом при поддержке Российского Фонда фундаментальных исследований был создан серийный образец системы ВО, который был успешно применён для выполнения ряда проектов в фундаментальной науке, промышленности и образовании. Кроме того по конкурсу РФФИ научных проектов, выполняемых ведущими молодежными коллективами была разработана универсальная система оптического захвата движений. Целью данного проекта является исследование технологий виртуального окружения и создание комплекса на их основе, реализующего человеко-машинный интерфейс с возможностью проведения экспериментальных измерений степени восприятия виртуального пространства и точности позиционирования и манипуляций. Особое внимание уделяется системе визуализации сверхвысокого разрешения и естественному интерфейсу на основе захвата моторики рук. Актуальность реинжиниринга технологий виртуального окружения обусловлена новыми вызовами современности. Постоянно растущая сложность физических явлений, изучаемых в научных и инженерных дисциплинах, требует разработки новых подходов и мощной технологии для обработки и анализа больших массивов сложных данных. Постоянно растущая сложность создаваемых машин и механизмов, зданий и сооружений, транспортных систем и технологических процессов, также требуют новых подходов при проектировании и создании прототипов. Постоянно растущая сложность управляемых человеком машин и механизмов, объектов и процессов требуют новых методов и средств для обучения персонала. Текущий момент характеризуется катастрофическим ростом информации, которое необходимо обрабатывать для поддержания прогресса в развитии современной цивилизации. Объём данных растет быстрее, чем производительность компьютеров, которая, следуя закону Мура, удваивается каждые полтора года. Развитие систем визуализации по разрешающей способности в разы отстает от производительности процессоров. Для создания экрана высокой разрешающей способности используется компоновка группы проекторов или мониторов. Характерным примером составного экрана ультра-высокой разрешающей способности служит установка виртуального окружения в университете Stony Brooks, NY, USA, 4 стены которой вмещают 416 LCD-мониторов. В разрешении 2560х1440 пикселей на каждом мониторе общая разрешающая способность установки превышает 1.5 Гигапикселей и является мировым рекордсменом. Из всего многообразия инструментов виртуального окружения в данном проекте мы акцентируем внимание на двух основных: (1) улучшение естественного интерфейса для манипулирования виртуальными объектами; (2) повышения качества отображения виртуальных сцен за счет повышения разрешающей способности средств отображения и учета трекинга взгляда. Эти инструменты являются ключевыми для виртуального окружения, судя по определению: технология виртуального окружения определяется как «интерактивная графика в реальном времени с трёхмерными моделями, когда комбинируется специализированная технология отображения, погружающая пользователя в мир модели, с прямым манипулированием объектами в пространстве модели». Оригинальным подходом к реализации функций захвата движения является использовании комбинации групп датчиков глубины, в том же мобильных — размещенных непосредственно на операторе. Для повышения разрешающей способности системы визуализации предлагается использовать группу жидкокристаллических мониторов, объединенных в единый панорамный экран. Предлагаемые нами методы исследования в России и на Тайване ранее не проводились. Этот проект ставит своей целью разработку совершенно новых методов визуализации в виртуальном окружении на качественно новом уровне высокого разрешения и учета динамических сцен, использующих надежный математический фундамент, испытанные инженерные решения и новейшие инструменты такие, как камеры RGB-D. Участники проекта с Российской стороны: Чувилин К.В. (руководитель), Хламов М.А., Пестриков В.И., Афанасьев В.О. Участники проекта с тайваньской стороны: Timothy K. Shih (соруководитель проекта с тайваньской стороны), Hon-Hang Chang, Ankhtuya Ochirbat, Enkhtogtokht Togootogtokh, Kai-Jen Cheng, Yun-Wen Huang, Yu-Ting Cheng.

17-07-00762 «Исследование и разработка системы обеспечения безопасности на основе природоподобных технологий, визуальной аналитики и многомерных хранилищ данных». Руководитель проекта Копылов Г.И.
В последние годы природоподобные технологии рассматриваются как наиболее перспективные с точки зрения поддержания экологического равновесия, обеспечения безопасности и противодействия потенциальной опасности, экономии ресурсов, информационной стабильности и поступательного развития. В природной среде, а особенно в животном мире, эти качества обеспечиваются постоянным информационным обменом, главным образом, с помощью присущих животным сенсоров, как элементам органов чувств. Сенсоры также являются необходимыми элементами большинства сложных технических систем (СТС), в частности, систем технического автоматического приборного мониторинга, или мониторинга по состоянию, создаваемого для непрерывного наблюдения и, в конечном итоге, обеспечения безопасности. Данный проект является естественным продолжением проекта 14-07-00362 «ПАК для анализа многомерных данных с использованием визуальной аналитики, виртуального окружения и современных инструментов взаимодействия человека с компьютером», он направлен на разработку системы обеспечения безопасности на основе природоподобных технологий, визуальной аналитики и многомерных баз данных. Ключевым моментом проекта является развитие системы визуальной аналитики — одной из наиболее актуальных информационных технологий, в которой человеческие и машинные ресурсы объединяются для решения спектра задач, непосильных для человека или компьютера по отдельности. Это область анализа данных, акцентированная на принятии решений на основе предварительной обработки данных, извлечения информации из данных и дружественных интерфейсах. Системы непрерывного мониторинга СТС являются новым этапом развития систем обеспечения безопасности (СОБ), в чем-то приближающимся к СОБ в живой природе. Текущее состояние СОБ показывает, насколько их эффективность далека от показателей в живой природе: по размерам и чувствительности сенсоров, по принципам обработки информации и по надежности регистрации опасности. Необходимость повышения безопасности СТС настоятельно требует сокращать эту дистанцию, используя новые принципы построения сенсоров и анализа окружающей обстановки. Бионика безопасности должна получить достойное развитие для обеспечения защиты СТС. Участники проекта: Копылов Г.И. (руководитель), Рейнгольд Л.А.

17-07-00833 «Разработка архитектуры и прототипа ИАС для демонстрации решений АСУ ТП АЭС на основе виртуального окружения». Руководитель проекта Захарушкин В.Ф.
Выполнение монтажа и наладки сложного электронного оборудования АСУ ТП атомных электростанций представляет достаточно сложный технологический процесс, требующий высокой квалификации исполнителей. Для АСУ ТП АЭС характерно наличие большого количества подсистем (более 30), большой объём разнородного оборудования (датчиков, коммутаторов и др.). Для проведения ремонтно-профилактических работ обслуживающий персонал АЭС должен пользоваться инструкциями по проведению соответствующих работ. Объём эксплуатационной документации достигает десятки тысяч листов. Как следствие, даже квалифицированные ремонтники вынуждены тратить значительное время для поиска соответствующей документации, ознакомления с ней, контроля соответствия своих действий с заданной в документации технологией работ. Трудности представляет не столько поиск и выборка конкретных инструкция по обслуживанию требуемого оборудования, сколько практическое следование этим инструкциям, то есть оперативная информационная поддержка действий персонала и контроль соответствия его действий технологическому процессу, определённому изготовителем этого оборудования (программных средств). В настоящее время таких средств обслуживающему персоналу разработчики АСУ ТП АЭС не предоставляют. Особенно острой указанная проблема становится в случае ремонта, замены оборудования или проведения профилактических работ для персонала АЭС, расположенных вдали от производителя или обслуживающих центров. Это особенно характерно для АЭС за границей, в развивающихся странах, поскольку присутствие или вызов квалифицированных технических специалистов производителя затруднён или весьма дорог, а квалификации местных специалистов недостаточно для оперативного решения возникших проблем. Применение технологии виртуальной и дополненной реальности в приложении к созданию и внедрению АСУ ТП АЭС является новым и перспективным направлением. В рамках 2 этапа проведения работ (январь-декабрь 2018) в соответствии с заявкой проводились работы по реализации моделей и макетов создания системы визуализации контрольной информации АСУ ТП АЭС (система «Дополненная реальность-ПП»). В качестве объектов для демонстрации возможностей применения в системах автоматизации, использующих технологию дополненной реальности, предложены следующие технологические процессы обслуживания оборудования АСУ ТП АЭС, входящие в состав оборудования Типового Программно-Технического Средства (ТПТС) производства ФГУП «НИИА» им. Н.Л. Духова. Система «Дополненная реальность-ПП» структурно представляет собой два программных приложения для устройств визуализации: очки дополненной реальности Epson BT-350 и электронного планшета. Оба типа устройств работают под управлением операционной системы ОС Android версии 5.1 или выше. Разработанный макет информационной системы позволяет реализовать усовершенствованный процесс визуализации процесса обслуживания оборудования, обучения ремонтников, контроля выполнения технологических процессов. Участники проекта: Захарушкин В.Ф. (руководитель), Соломенцев Я.К., Хламов М.А.

17-07-01475 «Стойкость региона к каскадному распространению системных аварий по взаимозависимым сетям жизнеобеспечения». Руководитель проекта Кириллов И.А.
Понимание природы и закономерностей различных типов взаимозависимостей между отдельными системами критической инфраструктуры региона (электроэнергетика, телекоммуникации, газ, транспорт, вода и т.д.) необходимо для идентификации и минимизации рисков, смягчения последствий и эффективного восстановления после каскадного распространения системы функциональных отказов и структурных повреждений. Особую актуальность данная проблема имеет для обособленных (по тем или иным причинам) регионов, имеющих ограниченные возможности по восстановлению, замещению и использованию резервов и ресурсов соседних регионов. Цель проекта — разработка, верификация и валидация количественного метода риск-информированной оценки стойкости (меры структурно-функциональной и адаптационной устойчивости) инженерно-технической инфраструктуры отдельного региона к системным авариям, индуцированным или вызванным множественными опасными воздействиями природного, техногенного и антропогенного характера (комбинированными или последовательными). На первом этапе проекта буду разработаны модели и инженерные методики генерации сценариев каскадных аварий, ранжирования уязвимостей и критичности элементов, ранжирования многофакторных взаимозависимостей между сетями, методы моделирования как распространения отказов между сетями, так и восстановления функционирования сетей. На втором этапе проекта разработанные инструменты для оценки и количественного моделирования рисков, уязвимости и стойкости будут калиброваны на эмпирических данных, опубликованных в научно-технической литературе и полученных в ходе работ МЧС РФ в Калининградской области, Крыму и Арктике. Модели и методики будут разрабатываться для моделирования и проектирования только инженерно-технической «системы-систем» жизнеобеспечения, включающей электроэнергетику, телекоммуникации, вода, газ, транспорт. Вопросы административного и политического управления, экономики и социальных взаимодействий будут учитываться только в степени, необходимой для выполнения основной задачи проекта. На третьем этапе проекта разработанные аналитические инструменты и результаты верификационных расчетов тестовых сценариев будут использованы сначала для предварительной («слепой») оценки стойкости в одном из регионов РФ (по согласованию с МЧС РФ), а затем валидированы в полевых исследованиях. Участники проекта: Кириллов И.А. (руководитель), Берберова М.А., Мещерин С.А., Пантелеев В.А.

18-07-00225 «Исследование и разработка «Универсального Словаря Образов» для создания человеко-машинного интерфейса». Руководитель проекта Рыков В.В.
Об актуальности проекта свидетельствует измерение популярности тематики в Интернете — запрос Паутине по теме проекта дает 18900 результатов, а новизна определяется конкретикой, например, запрос «Универсальный Словарь Образов» — дает «No results found for» и 1 результат M24.RU — 10 неизвестных: монстры, лестницы, воронки и ключи … www.m24.ru/articles/112668/ … Предлагаемый проект предполагает создание банка различных уже существующих образов, имеющих широкое распространение и могущих стать средством межнационального общения для людей, у которых нет иного канала обмена информацией. В число таких образов могут входить распространенные жесты, знаки ориентировки на дорогах, в транспорте, на улице, в местах общего пользования и в государственных учреждениях. Они будут включать как отдельные образы, так и их комбинации, составляющие цельный понятийный комплекс (как вести себя за столом, в транспорте, на стадионе и пр.). Надо четко отметить, что предлагаемый словарь рассчитан на межличностное человеческое общение. Компьютерное распознание образов не может являться в данном случае основной целью реализации проекта. Ориентация на межличностное общение дает нам возможность выбирать образы для словаря и, что не менее важно, устанавливать практически выполнимые задачи на каждом этапе его создания. Скажем, на первом этапе мы установим следующие границы — собрать сто словарных статей по нескольким группам образов; снабдить их словарными пояснениями на русском, английском и еще одном языке потенциальных потребителей, разбить их на соответствующие группы и пр. Это даст нам опыт работы, который выльется в дальнейшем в привычные навыки создания словарных статей. Это даст нам также конкретное представление, как организовывать работу в дальнейшем — какие исполнители и материалы нам потребуются, временные параметры для второго и последующих этапов и т.п. Нам будет несложно набрать сто таких и похожих сюжетов, представить их в компьютерном воплощении и предложить в качестве модели будущего словаря, который будет постоянно пополняться, как в плане совершенствования уже имеющихся статей, так и в создании новых словарных единиц и даже целых тематических комплексов. Участники проекта: Рыков В.В. (руководитель), Золотарев О.В., Местецкий Л.М., Орлов Д.Е., Соломоник А.Б., Тирас Х.П., Хакимова А.Х.

18-07-00909 «Исследование и разработка методов и алгоритмов оценки межъязыкового семантического подобия текстов для анализа их идеологического влияния». Руководитель проекта Хакимова А.Х.
Проект направлен на решение фундаментальной научной проблемы семантического моделирования, в рамках которой разрабатывается методика оценки семантического подобия текстов на различных языках. Исследование основано на гипотезе о том, что близость векторных представлений терминов в семантическом пространстве можно интерпретировать как семантическое сходство в межъязыковой среде. Индекс семантического текстового сходства (ИСТС) будет строиться с учетом наличия терминов и идей с близким семантическим представлением. Каждому тексту будет сопоставлен вектор в едином многоязыковом семантическом векторном пространстве, мера семантического подобия текстов будет определяться мерой близости соответствующих векторов. Для построения векторов будут использованы технологии Word2Vec, NASARI, использующие многоязыковые лингвистические ресурсы, такие, как WordNet, Wikipedia, BabelNet и др. Для автоматического выявления сходных фраз и семантических эквивалентов используются разработанный и развиваемый коллективом авторов лингвистический процессор, методы тематического анализа (LDA, LSA, ARTM), метод построения ассоциативного портрета предметной области (АППО), основанный на методах статистики и дистрибутивной семантики. Разрабатывается методика построения динамически пополняемой многоязычной коллекции документов из опубликованных в сети текстовых документов с помощью методов дистрибутивной семантики (АППО). Мы предлагаем количественный показатель, который измеряет степень семантического подобия разноязыковых текстов (Индекс Семантического Текстового Сходства) на основании выявленных межъязыковых семантических неявных связей. Расчет ИСТС производится с помощью введенного авторами показателя – меры подобия двух произвольных текстов, настройка параметров которой основана на корреляции с наличием формальной ссылки между ними. Мера семантического подобия выражает наличие двух общих терминов, фраз. Оптимальные параметры алгоритма выявления неявных связей подбираются на тематической коллекции путем максимизации корреляции явных и неявных связей. Авторами предложена и частично апробирована гипотеза о близости оптимальных параметров алгоритма расчета неявных ссылок в различных текстовых корпусах. На основании результатов обработки многоязыковой коллекции текстов в определенной предметной области будут найдены оптимальные параметры для алгоритма расчета ИСТС, затем этот алгоритм будет применен для текстов разной тематики с экспертным уточнением оптимальных параметров. С помощью предлагаемого индекса ИСТС будет возможным уточнение информационного поиска значимых текстов и первоисточников; автоматическое извлечение документов из интернет-среды исключит трудоемкость ручной оценки значимости текстов. Межъязыковое определение семантического текстового подобия является важным шагом для обнаружения и оценки межъязыкового плагиата, исследования в данном направлении редки. Дополнительно проект затрагивает следующие задачи: автоматизированная оценка и улучшение систем машинного перевода; кросс-культурный анализ коммуникативных стратегий; развитие интеллектуальных Интернет-технологий; повышение эффективности семантического поиска за счет точного моделирования сходства смысла предложений; выявление унифицированных терминов и словосочетаний для нескольких языков; ранжирование межъязыковых пар слов по их смысловому сходству или связанности; автоматизированное формирование многоязычных тезаурусов и интерактивных предметно-ориентированных энциклопедий. Методология была частично апробирована участниками проекта при создании и анализе коллекции научных статей по компьютерной графике и представлена на конференции CyberWorlds 2017 (Великобритания). Методология также была частично апробирована участниками проекта в энциклопедии ключевых понятий KEYWEN, осуществляющей направленное извлечение энциклопедической информации из Интернет. Проект опи-рается на созданную и развиваемую заявителями инструментальную среду ДЕКЛ, применяемую при построении логико-аналитических систем (ДИЕС, Криминал, Резюме, Антитеррор) и семантико-ориентированных систем извлечения знаний (Semantix и др.). Участники проекта: Хакимова А.Х. (руководитель), Золотарев О.В., Клоков А.А., Кузнецов К.И., Маравин А.А., Потапова З.Е., Протасов В.И., Родина И.В., Соколов Е.Г., Шарнин М.М.

18-07-01111 «Исследование и разработка лингво-статистических методов и алгоритмов автоматического формирования многоязычного ассоциативно-иерархического портрета предметной области для дополнения онтологий, определения значимых документов и перспективных направлений». Руководитель проекта Золотарев О.В.
Проект направлен на решение фундаментальной научной проблемы семантического моделирования, в рамках которой разрабатывается методика автоматизированного выявления связей перевода (переводных соответствий), а также иерархических, синонимических и ассоциативных связей из интернет-текстов и построение Многоязычных лингво-статистических Ассоциативно Иерархических Портретов различных Предметных Областей (МАИППО), в частности, по автономным необитаемым подводным аппаратам (АНПА). Учет разноязычных и разнородных ресурсов позволяет получить более полную картину происходящего в предметной области, выявить источники происхождения идей, скорость и направления их распространения, определить значимые документы и перспективные направления. Решение проблемы строится на основе комплексного подхода, сочетающего методы статистики, корпусной лингвистики и дистрибутивной семантики, и реализуется в технологии, которая предполагает разработку лингво-статистических механизмов формирования многоязычного ассоциативного портрета предметной области (МАИППО), представляющего собой словарь значимых терминов предметной области, элементы которого организованы в синонимические ряды (синсеты), включающие переводные соответсвия, а также ассоциативные и иерархические связи. МАИППО создается автоматически на базе статистического анализа больших объемов текстов из Интернет. Иерархические связи, входящие в МАИППО, образуют полииерархию и классификатор, облегчающие поиск и навигацию в многоязычной предметной области АНПА (ПО АНПА). Предлагаемая методика также включает в себя интеграцию различных МАИППО с многоязычными лингвистическими ресурсами (WordNet, Wikipedia, BabelNet и др.) для получения крупнейшей многоязычной онтологии с актуальными знаниями и улучшенным покрытием терминологии в рассматриваемых предметных областях. Объединенная (интегральная) онтология содержит иерархию синонимических рядов (синсетов) из многоязычных терминов, включая русские, и служит основой для построения единого многоязычного векторного пространства, позволяющего оценивать семантическую близость разноязычных текстов, синсетов и терминов, аналогично методикам NASARI и MAFFIN. Переводные соответствия между разноязычными синсетами МАИППО строятся с использованием технологии Word2Vec. Интегральная онтология позволяет рассчитывать интегральную разноязычную статистику и тренды использования терминов и идей, что позволяет прогнозировать распространение идей между языками и определять перспективные направления. Мера семантической близости разноязычных документов позволяет выявлять неявные ссылки между документами и определять значимые документы, что необходимо для сбора качественной информации из открытого Интернета и построения больших актуальных многоязычных корпусов предметной области. Таким образом повышение размера и качества интегральной онтологии позволит строить более качественную меру подобия и предметные корпуса текстов, извлечение знаний из которых в свою очередь еще более повысит размер и качество интегральной онтологии. На основе иерархии категорий обрабатываются тексты научных статей ряда предметных областей (включая АНПА) и выявляются тренды использования новых концептов и идей, интегрирующие знания различных языков, для определения перспективных направлений. Подобная методика позволяет решать широкий класс задач как в области когнитивной семантики, так и в области информационно-поисковых методов, так как МАИППО может в большинстве случаев, связанных с контекстным поиском, заменить или дополнить многоязычный тезаурус/онтологию предметной области, составление которого вручную представляет собой весьма трудоемкую задачу. Методология была частично апробирована в разработанной авторами проекта энциклопедии ключевых понятий KEYWEN и осуществляющей направленное извлечение многоязычной энциклопедической информации из Интернет. Проект также опирается на созданную и развиваемую заявителями проекта оригинальную инструментальную среду ДЕКЛ, нашедшую широкое применение при построении логико-аналитических систем (ДИЕС, Криминал, Резюме, Антитеррор) и семантико-ориентированных систем извлечения знаний (Semantix, и др.). Участники проекта: Золотарев О.В. (руководитель), Галина И.В., Гуров А.С., Мацкевич А.Г., Попченко О.В., Раскатова М.В., Родина И.В., Тезадова Ф.М., Шарапова Л.В., Шарнин М.М.

19-07-00455 «Разработка моделей, алгоритмов и программного комплекса для решения задач оценки безопасности и риска на АЭС при запроектных авариях с выбросом источников тепловых нейтронов с низкой плотностью потока». Руководитель проекта Берберова М.А.
Данный проект направлен на разработку моделей, алгоритмов и программного комплекса для проведения мероприятий по повышению безопасности и снижению риска при проектировании новых и эксплуатации действующих атомных электростанций. Принципиальной новизной проекта является разработка методического аппарата для оценки радиационного риска на АЭС при наиболее опасных (запроектных) авариях с выбросом источников тепловых нейтронов с низкой плотностью потока. Ядерные реакторы, основанные на использовании энергии деления тяжелых ядер, являются мощными источниками гамма-излучения и нейтронов. Проект направлен на компьютерное моделирование и разработку новых методов, алгоритмов и программного комплекса для решения задач оценки безопасности и риска на АЭС при наиболее опасных (запроектных) авариях с выбросом источников тепловых нейтронов с низкой плотностью потока. Для реализации проекта необходимо: разработать методический подход для решения задач оценки доз внешнего и внутреннего облучения и оценки ущерба населения, проживающего вокруг АЭС при наиболее опасных (запроектных) авариях с выбросом источников тепловых нейтронов с низкой плотностью потока; провести расчеты для населения, учитывая его возрастной состав. На основе этих решений будут предложены мероприятия по снижению риска и повышению безопасности АЭС. Участники проекта: Берберова М.А. (руководитель), Андреев В.В., Андреев Н.Г., Андреева О.В., Золотарев С.С., Оздоева А.Х., Орехова Е.Е., Тарасова Н.П., Тарасова Ю.С., Чернявский К.И.

19-07-00844 «Новые методы формирования и применения многомерных визуальных моделей для представления, обработки, анализа, интерпретации и использования больших мультисенсорных данных». Руководитель проекта Захарова А.А.
Конечная цель использования различных научных методов в сфере фундаментальных исследований – поиск неявных закономерностей в данных и представление больших массивов данных в доступном для дальнейшего анализа виде. Современный уровень развития информационных технологий позволяет вывести обработку и визуализацию больших мультисенсорных данных на совершенно новый уровень благодаря доступу к значительным вычислительным ресурсам и использовать все средства визуального анализа. Проблема анализа данных в сфере фундаментальных исследований широко известна и активно решается с помощью существующих статистических методов обработки, однако, подобный анализ затруднен при увеличении числа рассматриваемых параметров, изучении сложных нелинейных зависимостей и на стыке фундаментальных наук со слабо формализуемыми областями знаний. В таких случаях выявление причинно-следственных связей, механизмов и параметров взаимодействия данных нерешенной и крайне востребованной задачей, так как позволит контролировать качество и скорость поиска решений. Поиск точек с наилучшим соответствием сравниваемых параметров для задач в слабо формализуемых областях знаний затруднен сложностью представления многих исследуемых параметров в числовом или логическом виде. В таких случаях использование визуальной аналитики при рассмотрении нечисловых факторов помогает преодолеть семантические и онтологические разногласия между сопряженными областями знаний и синтезировать новое знание, недоступное при прямой статистической обработке. В рамках данного проекта предлагается исследование возможностей по работе с общедоступными данными на стыке фундаментальных наук, визуальной аналитики и информационных технологий с последующим созданием методики и инструмента анализа больших мультисенсорных данных нового поколения. Цель данного проекта — разработка методики и реализующего ее математического аппарата, основанных на комплексе методов и алгоритмов для структурирования, обработки и хранения большого объема многомерных данных комплексных систем, а также создание на ее основе системы обработки и хранения таких данных с возможностью интерактивного визуального анализа. Значимость исследования определяется как систематизацией подходов к проблеме разработки высокопроизводительных систем хранения и обработки многомерных разнородных данных, так и демонстрацией эффективности применения этих подходов для оптимизации всех компонент таких программных систем под конкретную прикладную задачу в рамках анализа больших мультисенсорных данных и заданные требования. Новизна проекта заключается в создании методики бесконфликтного объединения и структурирования большого объема разнородных данных в слабо формализованных задачах, предоставляющей возможность более полного исследования и анализа. Полученная в результате информационная структура позволит оперативно исключать из потока данных те составляющие, которые являются избыточными в условиях сформулированной цели исследования. Предлагается методика адаптируемого анализа и агрегации многомерных данных, позволяющая получать результаты анализа в условиях изменяющегося набора источников в рамках задачи анализа больших мультисенсорных данных. В качестве апробации новых моделей и методов в данном проекте предлагается практическая реализация прототипа системы в виде комплекса визуальных моделей, методов и средств программной поддержки в виде инструмента анализа и визуализации мультисенсорных показателей, оценки и прогнозирования функционирования систем. Соответственно, можно предложить программную систему, которая поможет в представлении и понимании сложных процессов посредством сбора, агрегации и использования средств визуального анализа на многомерной разнородной информации. Участники проекта: Захарова А.А. (руководитель), Завьялов Д.А., Исламов Р.Т., Клименко В.С., Подвесовский А.Г., Небаба С.Г., Шкляр А.В.

19-07-00857 «Исследование и разработка методов и алгоритмов семантометрической оценки влияния научных статей в многоязыковой и многодисциплинарной среде путем построения «Индекса интегрального научного влияния». Руководитель проекта Шарнин М.М.
Проект направлен на решение фундаментальной научной проблемы семантического моделирования, в рамках которой разрабатывается методика оценки качества научных статей на основе вероятностной модели влияния (impact) научной статьи на цитирование и идеи в последующих статьях, а также на основе модели представления идеи в виде множества ключевых терминов и сходных по смыслу фраз в многоязыковом семантическом поле. Проблема оценки качества научной продукции в настоящее время приобретает все большую остроту и новые подходы к ее решению являются востребованными при оценке общего вектора развития мировой науки, прогноза и планирования фундаментальных и прикладных исследований, оценки вклада отдельных исследователей и научных школ в развитие отечественной и мировой науки. Многие существующие методы оценки влияния и качества научных статей основаны на использовании подсчета цитирования, который показателен лишь по прошествии значительного периода времени после публикации. Кроме того, коммерциализация науки привела к возможности злоупотреблений метрическими показателями, не связанных с качеством работы. Использование текущих показателей эффективности исследовательских публикаций (Bibliometrics, Altmetrics, Webometrics и т. д.) основано на оценке влияния (качества) исследовательского документа лишь на основе внешних данных (данные об авторах и месте публикации). Мало исследований, которые включают все содержимое документов. Предлагаемое в проекте дополнение наукометрических и библиометрических показателей вычислительным семантическим анализом полнотекстовых публикаций является передовым. Предлагаемая методика использует новый показатель качества научной статьи — Индекс Интегрального Научного Влияния (ИИНВ), который рассчитывается автоматически по неявным контекстным ссылкам на документ и связан со статистической вероятностью ожидаемого появления прямых библиографических ссылок. С целью измерения межъязыкового семантического подобия мы создаем собственный многоязычный ресурс, аналогичный BabelNet, – архитектор знаний Кейвен, структурирующий информацию на основе мегалемм и нейросетей, который позволяет находить более точные источники идей независимо от языка, выявлять более раннюю стадию появления идеи, а также обнаруживать ее подтверждение в разноязыковых источниках. Межъязыковые ссылки имеют больший вес (значимость), чем ссылки внутри одного языка, кроме того, междисциплинарные ссылки имеют больший вес, чем ссылки внутри одной дисциплины. Обрабатывая многоязычную информацию в разных научных областях, мы получаем интегральную (многоязычную, междисциплинарную) статистику, которая позволяет более точно прогнозировать динамику явного и неявного цитирования идей, фраз и документов. Смысловое подобие текстов определяется с помощью грамматических трансформаций, программ перевода и замен синонимов, авторской методики построения ассоциативного портрета предметной области, метода Word2Vec и нейросетей для выявления подобия терминов и фраз. Вероятностная модель зависимости количества прямых цитирований от количества неявных ссылок и их параметров строится на основе лингвистического процессора, выявляющего неявные ссылки, настраиваемого с помощью метода машинного обучения. Решение проблемы строится на основе комплексного подхода, сочетающего методы статистики, нейросетей, корпусной лингвистики и дистрибутивной семантики, и реализуется в технологии, которая предполагает разработку лингво-статистических механизмов формирования ИИНВ. Подобная методика позволяет решать широкий класс задач, как в области когнитивной семантики, так и информационно-поисковых, например, поиск идей, оценка качества научных статей, составление рейтинга сайтов. Дополнительно проект затрагивает следующие задачи: мониторинг новых идей и оценка их перспективности; анализ преемственности научных идей; обнаружение межъязыкового текстового заимствования; развитие интеллектуальных Интернет-технологий; обнаружение и выделение качественной информации из многоязыкового Интернет-пространства. Методология была частично апробирована в архитекторе знаний KEYWEN, — программном комплексе, осуществляющем направленное извлечение значимой информации из Интернет-среды. Проект опирается: на авторскую разработку — инструментальную среду ДЕКЛ, представляющую найденные иерархические и ассоциативные связи в виде онтологии для сопоставления иерархических структур и связей на разных языках; на разработки выявления межъязыкового семантического подобия на основе мегалемм; на созданный авторским коллективом лингвистический процессор BREF, автоматически выделяющий библиографические ссылки из отдельных научных публикаций. Участники проекта: Шарнин М.М. (руководитель), Гуров А.С., Клоков А.А., Кузнецов К.И., Протасов В.И., Родина И.В., Соколов Е.Г., Хакимова А.Х.

19-07-01167 «Разработка методов интеллектуального анализа научных публикаций для мониторинга и долговременного прогноза приоритетных направлений развития превентивной и персонализированной медицины». Руководитель проекта Хакимова А.Х.
В настоящее время проблема разработки методов определения перспективных направлений, трендов научных исследований и технологий превратилась в важнейшую составляющую процесса формирования национальной научной политики. Со значительным ростом объема публикаций в медицинских науках отслеживание эволюции исследований и прогнозирование будущих тенденций исследований имеют большое значение для специалистов. Проект направлен на решение фундаментальной научной проблемы семантического моделирования с помощью нейронных сетей, в рамках которой разрабатывается методика анализа корпусов научных данных как инструмент прогнозной аналитики (прогнозирование трендов и перспективных направлений исследований, выявление горячих тем, оценка точности прогноза). Для решения этой проблемы разрабатывается междисциплинарная комплексная методика с привлечением нейросетей, вероятностных моделей, статистики, машинного обучения, корпусной лингвистики, дистрибутивной семантики, визуального анализа. Целью проекта является разработка теоретических и технологических основ создания инструмента прогнозной аналитики научных публикаций, основанного на методах глубокого машинного обучения с помощью нейронных сетей и многоязычной онтологии, содержащей иерархию терминов/понятий, с применением методов тематического моделирования. Инструмент прогнозной аналитики предназначен для выявления перспективных направлений исследований (фронтов исследований, горячих тем) и построения долговременных прогнозов их будущих трендов, включая оценку их точности. Научная новизна предлагаемого проекта заключается в разработке новых способов расчета трендов научных направлений на основе передовых методик физико-математического моделирования и новейших компьютерных программ, включающих в себя методы тематического моделирования, семантического векторного представления текстов, рекуррентных нейронных сетей, вероятностных моделей, статистики, машинного обучения, корпусной лингвистики, дистрибутивной семантики, визуального анализа. Это позволит повысить скорость, точность и надежность прогнозов будущих трендов. Научная новизна проекта заключается также в формировании нового инструментария: базирующегося на современном нейросетевом и тематическом моделировании, отличающегося применением онтологического подхода, позволяющего обеспечить динамическое выявление актуальной лексики. Научная значимость проекта заключается в разработке оригинальных математических и лингвистических прогнозных моделей для анализа разноязычных научных текстов в области превентивной и персонализированной медицины с целью выявления пер-спективных направлений исследований. Применение таких вычислительных моделей: — даст возможность использовать Интернет как актуальную текстовую коллекцию; — позволит преодолеть языковые барьеры на основе модели представления и формализации идеи в виде множества терминов в многоязыковом семантическом поле; — позволит использовать в качестве лексического базиса динамически пополняемую при помощи нейросетей многоязычную онтологию. Разрабатываемая в рамках проекта прогнозная аналитика, включающая долговременный прогноз будущих трендов и оценку его точности, позволит: — выявлять устойчивые тренды и направления развития на ранних стадиях их возникновения; — исследовать признаки устойчивого зарождающегося тренда (путем измерения их влияния на точность прогноза); — исследовать динамику процессов развития научной области и возникновения в ней новых направлений. Участники проекта: Хакимова А.Х. (руководитель), Золотарев О.В., Клоков А.А., Кузнецов К.И., Маравин А.А. Родина И.В., Соколов Е.Г., Шарнин М.М.