Способ управления форматом вывода библиографического описания публикационных объектов в соответствии с ГОСТ 7.1-84 на основе универсального языка разметки

NovaInfo 40, с.7-12, скачать PDF
Опубликовано
Раздел: Технические науки
Просмотров за месяц: 1
CC BY-NC

Аннотация

В статье предлагается способ формирования библиографического описания различных массивов публикационных объектов, полученных в результате выполнения запросов на выборку в информационных системах управления базами результатов интеллектуальной деятельности сотрудников научных и образовательных организаций. Подобный способ является неотъемлемой составляющей информационно-аналитической системы мониторинга эффективности научной деятельности сотрудников INTRASCIENE, внедренной в Вологодском государственном университете. Информационная система и данный метод внедрены и успешно используются.

Ключевые слова

ИНФОРМАЦИОННАЯ СИСТЕМА, ИННОВАЦИОННАЯ ДЕЯТЕЛЬНОСТЬ, БИБЛИОГРАФИЧЕСКОЕ ОПИСАНИЕ, ПУБЛИКАЦИОННЫЙ ОБЪЕКТ

Текст научной работы

Сегодня каждая образовательная организации Российской федерации столкнулась с проблемой оперативного анализа публикаций своих сотрудников. Рынок программного обеспечения не сумел своевременно и адекватно ответить на эти запросы. В результате многие университеты и институты используют неавтоматизированные или слабо автоматизированные методы работы с массивом публикаций (самым распространённым из них является ведение огромных таблиц в MS Excel со множеством полей). Данный подход характеризуется очевидными недостатками: высокая степень погрешности, низкие аналитические возможности, неудобство работы. Некоторые образовательные организации начали разработку своих собственных программных продуктов, которые должны были решить все обозначенные задачи, к которым относятся: сбор и агрегация данных о публикациях сотрудников, выполнение запросных и поисковых процедур по всему массиву публикационных объектов, посторенние различных отчетов с возможностью настройки уровня детализации. Такие информационные системы обычно используются только внутри организации, которая их разрабатывала. Существуют и качественные программные разработки, которые можно внедрять в другие организации. Ярким примером такой информационной системы является программный продукт IntraScience, разработанный в Вологодском государственном университете. Система содержит весь необходимый функционал и постоянно развивается.

Актуальные компьютерные системы описанной отрасли реализуют процедуры контроля за результатами публикационной деятельности сотрудников научных и научно-образовательных организаций (НИИ, вузов и т.п.) и позволяют в режиме реального времени качественно исследовать и строить прогнозы развития того или иного научно-инновационного направления в структурных подразделениях данной организации. Такие результаты представлены либо объектами авторского права, либо охранными документами (патентами и свидетельствами). Такие системы должны не только иметь богатую палитру процедурных элементов для накопления и обработки результатов издательской активности, но и уметь строить различные отчеты, соответствующие всем требованиям стандартов.

Форматированное описание публикаций, которое чаще всего называется библиографическим, активно и обязательно используется в ведущих зарубежных наукометрических системах Web of Science, Scopus и т.д., а также в популярных системах отечественной разработки, главным примером которых является известный и популярный РИНЦ.

Сегодня в мировом Интернет-пространстве реализовано и эффективно используется огромное количество web-сервисов для создания массивов простейших описаний публикаций, которые отличаются многообразием способов реализации и взаимодействия с пользователем. Примерами таких ресурсов являются: BiblioExpress, http://www.easybib.com, EndNote, http://www.bibme.org, SourceAidCitationBuilder, http://www.sourceaid.com, Biblioscape, Citeulike, Zotero и др.

В качестве аналога можно привести алгоритм работы Интернет-проекта MachineLearning.Ru. Библиография генерируется в формате BibTex.

Известно программное обеспечение Ю.В. Смирнова (http://www.tc1.tk/) для формирования списка литературы из базы данных и вставки в текстовый редактор (MS Word, LibreOffice Writer). Каждое поле файла базы данных состоит из трехзначного кода и его значения, разделенные знаком двоеточия, при этом поля отделяются друг от друга разрывом строки.

Общими недостатками указанных систем является то, что для описание каждого вида публикаций указанные аналоги предлагают только один формат вывода для всех типов объектов, который представляет собой полную библиографию, либо описание, не соответствующее установленному ГОСТ 7.1–84. При этом в существующих системах данного типа нет гибкой системы шаблонного редактирования вида вывода библиографического описания. Для дальнейшего использования и анализа такие списки публикаций нужно существенно редактировать, что заметно снижает оперативность работы. Для некоторых задач данный недостаток не является критическим, но большой объем дополнительных манипуляций для форматирования выходных списков под требования ГОСТ заставляет образовательные организации искать другие средства решения. Одним из таких программных продуктов, которые лишены обозначенных недостатков, является информационная система IntraScience.

В предыдущей работе [1] нами были сформулированы и описаны ключевые аспекты реализации поисковых алгоритмов в системе IntraScience. Была сформулирована важная системная задача по оптимизации и улучшению процедур, которые связаны с генерацией выходной строки публикаций (статей, тезисов, патентов, монографий, учебных пособий и т.п), информация о которых аккумулируется в БД и обрабатывается в ИС, в соответствии с ГОСТ 7.1–84.

Алгоритм, который представлен в данной статье, был реализован для подсистемы генерации отчетов системы IntraScience, описанной в работах [2-4], отвечающий за формирование форматированного массива объектов-результатов (инновационной и публикационной деятельности) для выдачи конечному пользователю. Ключевым преимущественным аспектом представленного метода является то, что он реализует алгоритмы управления форматом (внешним видом, формой) вывода каждого объекта-результата, при этом учитываются все входные параметры решаемой задачи. Представленный механизм в системе IntraScience реализован через специальный макроязык разметки (множества адресных тэгов). С каждым типом публикации при использовании описанного метода можно ассоциировать специальный шаблон, скомпонованный из тэгов и прочих символов и определяющий форму вывода объектов-результатов каждого конкретного вида.

Рассмотрим формат и структуру шаблона, который в первом приближении является простой строкой символов. В состав шаблона могут входить два вида элементов.

1. Специальные тэги разметки. Каждый такой тэг можно рассмотреть как ссылку на поле таблицы БД ИС публикации. При формировании описания подсистема генерации отчетов анализирует шаблоны и через тэг-ссылку извлекает или рассчитывает результирующее значение. После этого результат передается в строку-описание визуализируемой публикации, отформатированной по заданному шаблону.

2. Общие ретранслируемые символы. Это любые символы, которые не входят в тэги-ссылки и блоком генерации отчета просто выводятся в выходную строку публикационного объекта-результата без изменений (см. рис. 1). Каждый шаблон оформляется согласно ГОСТ 7.1–84.

Реализация алгоритма
Рисунок 1. Реализация алгоритма

На основе базового набора публикационных атрибутов был построен следующий набор специальных тэгов разметки:

[Номер!], [Том!], [Диап!], [Год!], [Название!], [Издат!], [Вид!], [Журн!], [Город!], [Страна!], [Авторы!], [П_Автор!], [Стр_ч!], [Стр!], [Плстр_ч!], [Плстр!].

Каждый тэг имеет интуитивно понятное наименование, раскрывающее контекст его применения. Состав множества специальных тэгов зависит от задач организации, решаемых в области автоматизации учетных процедур анализа публикационной активности.

Для правильного построения строки-шаблона необходимо каждый тэг-ссылку заключать в квадратные скобочки. Тэг обязан быть уникально поименованным, что позволит блоку генерации отчетов однозначным образом его распознать и обработать[3].

Шаблон, который полностью соответствует указанным требования:

[П_Автор!] [Название!] / [Авторы!] // [Журн!], [Год!]. — № [Том!]. — [Стр_ч!] с.

Пример формы, содержащей описание публикационного объекта, представлен на рис.2.

В отформатированном виде этот объект выглядеть следующим образом:

Петухов, А.А. Значение политики Александра Ивановича Петрова для развития инновационных аспектов международных проектов в области культивирования крупного рогатого скота / А.А. Петухов, Д.Ф. Сологубов, М.В. Парамохин, А.Б. Суслопаров // Международный исследовательских журнал <Аграрные системы>, 2015. — № 9. — 9 с.

Все шаблоны хранятся в текстовых файлах. Для каждого шаблона должен быть отдельный файл. Внутри файла в первой строке располагается строка шаблона. Ничего другого в файле быть не должно. Файл должен иметь специальное расширение. Такие файлы удобно создавать и редактировать простым блокнотом [5].

Кроме шаблонов, которые можно построить для всех видов публикаций, в системе предусмотрен выделенный шаблон, опционально используемый по умолчанию. Шаблон по умолчанию обязательно должен храниться в файле, содержащем настройки программы.

Пример формы информационной системы
Рисунок 2. Пример формы информационной системы

Таким образом, описанный алгоритм позволяет автоматизировать учет и работу с библиографическим описанием публикаций, созданных сотрудниками научных и образовательных организаций за любой отчетный период.

Все работы, на которые в данной статье приводятся ссылки, выполнены при финансовой поддержке Министерства образования и науки Российской Федерации в рамках проекта №1816 по заданию на выполнение государственных работ в сфере научной деятельности в рамках базовой части государственного задания высшим учебным учреждениям.

Читайте также

Список литературы

  1. Никифоров О.Ю. Ключевые поисковые возможности информационной системы анализа публикационной активности сотрудников научной или образовательной организации / О.Ю. Никифоров, А.А. Синицын // Современная педагогика. 2014. № 11 [Электронный ресурс]. URL: http://pedagogika.snauka.ru/2014/11/2948 (дата обращения: 21.11.2014).
  2. Sinitsyn, A.A. Informational System of Monitoring, Forecasting and Stimulation for Innovation-Oriented Activity of Scientific and Scientific-Pedagogical University Personnel / A.A. Sinitsyn, O.Y. Nikiforov // World Applied Sciences Journal, 2013; 27. p. 355-360. http://www.idosi.org/wasj/wasj27(elelc)13/72.pdf
  3. Синицын, А.А. Особенности анализа результатов интеллектуальной деятельности научно-педагогических кадров в вузе: Монография / А.А. Синицын, О.Ю. Никифоров. Saint-Louis, MO: Publishing House Science and Innovation Center, 2014. - 238 с.
  4. Синицын, А.А. Особенности применения информационно-аналитической системы для оценки направления поддержки по созданию результатов интеллектуальной деятельности научно-образовательной организации / А.А. Синицын, О.Ю, Никифоров, М.А. Андреев // Фундаментальные исследования – 2014. – № 11 (часть 4). – c. 1271-1275.
  5. Синицын, А.А. Концепция и структура информационно-аналитической системы анализа публикационной активности сотрудников научно-образовательной организации / А.А. Синицын, О.Ю, Никифоров, М.А. Андреев // Фундаментальные исследования – 2014. – № 11 (часть 4). – c. 1276-1280.

Цитировать

Никифоров, О.Ю. Способ управления форматом вывода библиографического описания публикационных объектов в соответствии с ГОСТ 7.1-84 на основе универсального языка разметки / О.Ю. Никифоров, А.А. Синицын. — Текст : электронный // NovaInfo, 2016. — № 40. — С. 7-12. — URL: https://novainfo.ru/article/4148 (дата обращения: 29.09.2022).

Поделиться