Информационное обеспечение - Информационные языки

Информационный язык АСУП — совокупность правил записи сообщений, отображающих определенный набор объектов и ситуаций, позволяющих на основе формальных процедур использовать в процессе обработки их смысл. Разработка информационного языка системы управления преследует следующие основные цели: перепоручение машине большого числа логических операций, связанных с переработкой смысла сообщений; упрощение общения с машиной за счет приближения языка программирования к естественному; унификация языка системы управления для реализации принципа интеграции обработки информации; объединение подсистем и устройств системы управления и достижение согласованности их функционирования посредством утверждения единой смысловой базы в языке их взаимного общения; упрощение планово-управленческой документации за счет внутримашинного хранения информации, в частности всех промежуточных показателей.

Язык АСУП можно представить как комплекс следующих компонентов: естественный язык системы управления; универсальные алгоритмические языки; конкретные машинные языки; языки описания и организации данных; специальные языки формирования запросов и общения потребителей с памятью системы; внутримашинные информационные языки.

Информационные языки с простыми функциями обеспечивают ввод текстовой информации в ЭВМ, ее хранение и вывод.

Информационно-поисковые языки обеспечивают эффективный поиск, выборку и обновление хранимой в памяти информации.

Информационно-справочные языки позволяют осуществить поиск, выборку, обновление хранимой в памяти ЭВМ информации, несложные операции группировки, сортировки, агрегации, дезагрегации показателей для обеспечения выдачи ответов по стандартным запросам. Эти языки применяются обычно в сочетании с операторными языками формулирования запросов к системе.

Информационные языки автоматизированных систем обработки данных служат для записи информации в специализированных массивах информационных систем, ориентированных на решение определенных комплексов задач в автоматизированном режиме.

Информационно-логические языки АСУ позволяют выполнять отдельные операции типа логических выводов и связаны с автоматическим принятием отобранных несложных решений с использованием таблиц решений.

Разработка информационного языка системы управления осуществляется с ориентировкой на основную единицу экономической информации — показатель. Для записи показателей обычно применяются простые информационные языки с позиционным синтаксисом. Различаются информационные языки без грамматики, с неполной грамматикой и языки с развитой грамматикой.

Информационный язык первого типа — тезаурус — представляет собой простое и эффективное средство осуществления элементарного смыслового анализа текстовой информации. Под термином «тезаурус» понимается запас сведений, которым располагает некоторая система. Тезаурус обычно означает словарь, единицы которого снабжены наборами признаков, характеризующих родо-видовые связи между ними, и сгруппирован по смысловой близости, причем для синонемических терминов выделены их основные представители — дескрипторы. Тезаурусы могут применяться в системах обработки данных обособленно и в составе информационного языка, т. е. с учетом грамматики этого языка, например шаблона для записи. Для создания тезауруса прежде всего необходимо точно описать значение всех употребляемых в данном языке слов и затем составить полный список слов-понятий этого языка. Создание идеологического словаря завершается классификацией слов-понятий, которая должна раскрывать объективные связи между ними.

Дескрипторы — это слова, устойчивые словосочетания и сокращения Дескриптор, входящий в тезаурус, может состоять как из одного слова, так и из группы слов. Наиболее часто встречающиеся сочетания терминов объединяются в один дескриптор.

Различают несколько типов тезаурусов, которые могут быть применены в АСУП. Тезаурус поисковый представляет собой словарь терминов, характерных для тон или иной области знаний или того или иного типа информации, называемых ключевыми словами, среди которых выделены дескрипторы. Слова в тезаурусе снабжены индексами, поясняющими их иерархические, родо-видовые, линейные, грамматические связи. Поисковые тезаурусы служат для поиска и подбора документов и текстов по определенной проблематике на основе приблизительного учета их смысла, исходя из просмотра содержащихся в них терминов и сопоставления их с терминами, включенными в поисковый образ.

Тезаурус управления строится на базе языка системы управления и соответственно содержит три уровня: слов, показателей и наименований форм документов. Для него характерна жесткая привязка его единиц к задачам, решаемым в системе управления. Основное назначение тезауруса — осуществление простейших операций по логической переработке показателей.

Тезаурус для ввода данных — упрощенный вариант тезауруса управления, служит для кодирования и ввода в ЭВМ управленческой информации и представляет собой кодовый словарь ключевых слов и дескрипторов языка системы управления. Содержит те же словарные единицы, что и тезаурусы управления, по форме построения и наполнению словарной статьи полностью аналогичен поисковому тезаурусу.

Универсальный тезаурус АСУП по форме совпадает с поисковым, но содержаться в нем будут высказывания языка системы управления.

Информационный язык второго типа применяется для кодирования показателей преимущественно оценочного типа, имеющих относительно несложную Структуру записи, а также в тех случаях, когда практически возможно введение для административно-управленческого персонала жестких правил на запись показателей. Это информационный язык упрощенного типа с неполной грамматикой.

Процесс разработки информационного с неполной грамматикой языка состоит в следующем. На основе анализа представительного количества высказываний, используемых в работе системы управления, строится универсальная конструкция высказывания, состоящая из набора позиций (фасетов). Малочастотные элементы конструкции отбрасываются. Составляется полный список слов (словник), определяющих лексическое накопление конструкции. Полученный словник подразделяется на списки, каждый из которых служит словарем для той или иной позиции конструкции. Позиция слова в конструкции служит показателем логико-семантической роли слова в высказывании (позиционный логический синтаксис). Номер отдельного списка слов совпадает с номером определенной позиции конструкции. Сущность данного метода кодирования состоит в приписании каждому из слов вводимого в ЭВМ высказывания номера позиции, определяющей его логическую и смысловую роль. Смысл всего высказывания в этом случае будет представлен парами чисел-номеров позиций и номеров слов с соответствующих списках словника:

т1n2; т3п2; m3n4; т2п6; m7n8

где т — номер позиции, а п — номер слова в списке Z (номер Z равен номеру ш).

Информационный язык третьего типа—это язык с развитой грамматикой, позволяющий кодировать показатели всех видов, в том числе регистрирующие и аналитические показатели, с высокой точностью отображения смысловых отношений между словами. При построении данного языка в результате анализа всех или подавляющей части показателей (берется их полная запись), содержащихся в документации, составляются словарь основ и общая для всех показателей грамматическая схема.

Обобщенная грамматическая схема показателя в укрупненном виде выглядит так: ОПК — ОДК —ОБК, где О — определение, П — подлежащее, Д — дополнение, Б — обстоятельство, К — постпозиционное определение, характеризующее предшествующее существительное.

Далее производится детализация схемы с учетом встречающихся в показателях грамматических функций, соответствующих отдельным подфункциям членов предложения и категориям слов, выполняющим эти подфункции. При составлении шаблона учитываются также значения отдельных категорий слов. Полученная детальная схема называется грамматико-семантическим шаблоном записи показателя.

Код показателя, полученный в результате использования словаря основ и грамматического шаблона, имеет следующий вид:

m4n145; m2n17; m4n323; m7n3,

где m — номер позиции в шаблоне и п — номер слова в словаре.

Для уточнения связей между словами может быть дополнительно составлена программа установления взаимосвязей слов в показателе по их порядковым номерам и позициям слов в шаблоне.

Кодирование на языке этого типа может осуществляться вручную оператором, а также автоматически с помощью модели порождения показателя и алгоритма кодирования.

При выводе показателен на печать выдаются основы слов показателей, расписанные по шаблону. Для получения нужных форм слов (приписания

окончаний) может быть использован алгоритм морфологического синтеза (подобные алгоритмы разработаны специалистами машинного перевода), однако более целесообразно поручить дописывание окончаний слов оператору, т. е, осуществлять постредактирование.