Интеллектуальный помощник в работе
с законодательством.
В последнее время все большую актуальность приобретают
вопросы информационной поддержки принятия тех или иных
управленческих решений. Персональные компьютеры стали
неотъемлемой частью современных офисов, и, как следствие,
все более широкое применение в деятельности работников
финансово-экономических служб находят справочные
информационные базы данных.
Одним из основных критериев их оценки служит
содержание базы (количество, полнота и новизна
предоставляемых материалов), так как в первую очередь поль-
зователь работает с базой для поиска, отбора и анализа
интересующих его документов. Практически все такие системы
имеют достаточно полные базы нормативных документов и
одинаковые возможности по их обновлению (как правило, это
осуществляется еженедельно, а иногда и ежедневно). Поэтому
при сравнительном анализе большое значение имеют сервисные
возможности систем, связанные с организацией обработки
запросов пользователей, в том числе наличие удобного и
понятного интерфейса, обеспечивающего диалог с поль-
зователем.
Для работающего с базой должен быть понятен принцип
отбора документов по запросу. Знание принципа работы
поисковой системы позволит пользователю правильно
сформировать запрос.
Степень подготовленности и структура потребностей в
информации пользователей баз данных весьма различаются.
Начинающие могут вполне удовлетвориться простыми запросами
по реквизитам документов или тематическим рубрикам по
принятой в каждой базе классификации. Однако пользователи,
уже накопившие определенный опыт работы с базами, хотят быть
уверены в том, что в найденные системой документы вошли
только те, которые им нужны. Обеспечить это может только
такая система, в которую уже при проектировании базы данных
и создании процедур обработки запросов заложены принципы
развернутого логического анализа информации.
Еще одной характеристикой базы является полнота
поиска: пользователь должен быть уверен в том, что системой
будет найдена вся необходимая ему информация по определенной
теме. Другими словами, в такой базе пользователь сможет по-
лучить и оценить всю относящуюся к запросу информацию, а не
ее часть.
Одной из таких систем является программный комплекс
"юсис 7.4" - полнотекстовая база данных действующего
законодательства российской федерации. Суммарный объем
различных документов в базе превышает 150 мбайт и
увеличивается в среднем на 5 мбайт в квартал. Система
предназначена для работы в операционной среде windows.
Для работы с такой базой в "юсис" реализован
разветвленный программный аппарат поиска, основанный на
использовании индексного метода. С помощью специальных
алгоритмов на этапе ввода материалов в базу устанавливаются
связи между понятиями и создается система индексации. Каждый
вводимый в базу данных текст документа автоматически
обрабатывается специальной программой морфологического
анализа. В результате создается отдельная база данных,
содержащая информацию о том, в каких текстах находится
каждое слово и какие слова окружают его. Она составляет
основу обеспечения диалога с пользователем. Система создает
также базовый словарь, содержащий слова в нормализованной
грамматической форме (например, для существительных - это
единственное число, именительный падеж), однако в ответ на
запрос пользователя будут найдены документы, содержащие
искомое слово или слова во всех грамматических формах. Такой
принцип организации базы предоставляет возможность вести
диалог с системой на языке, приближенном к естественному.
Подразумевается, что ответ на поставленный вопрос по-
льзователя, скорее всего, находится в конкретной логической
части текста документа - в абзаце или предложении, поэтому
база данных содержит также информацию о том, какие слова
сочетаются между собой в абзацах и предложениях во всех
текстах документов. Это позволяет производить экспертизу
запроса пользователя на каждом этапе его формирования и дает
возможность оперировать сочетаниями слов на уровне абзацев
или предложений. Системе, по существу, заранее известны все
возможные комбинации запросов пользователя и ответы на них,
содержащиеся в текстах.
Вначале запрос пользователя рассматривается как набор
произвольно составленных слов, затем проверяется, есть ли
первое включенное в запрос слово в текстах документов. Найдя
такие документы, система вносит их в список, подлежащий
просмотру. Далее производится обработка следующего слова
запроса и т.Д. В результате пользователь получает список
документов, в которых содержатся все эти слова.
Реализуя указанный алгоритм поиска, "юсис" проводит
экспертизу запроса и не пропустит в запрос словосочетание,
отсутствующее в текстах документов. Экспертиза запросов не
ограничивается анализом сочетания слов в структурных частях
текстов. Система в автоматическом режиме обеспечивает также
и усечение списка документов по реквизитам: номеру, дате и
т.Д. "Юсис" разрешает также обратную последовательность
отбора (сначала реквизиты, а потом словосочетания), проводит
экспертизу и в этом случае.
В системе предусмотрена предварительная экспертиза
запроса. Включение вспомогательных функций "синонимы" и
"определения" расширяют и уточняют его, учитывая слова,
реально использованные в документах. Благодаря этому
исключается возможность формирования безрезультатных
запросов.
Смысловая зависимость между различными документами,
правовыми и нормативными актами обеспечивается в "юсис"
специальным математическим алгоритмом.
Программный комплекс "юсис 7.4" разработан в двух
вариантах. Первый - "юсис универсал", главным достоинством
которого является доступность правовой информации даже для
неопытного пользователя. Это домашняя юридическая
консультация.
Вторая версия программы - "юсис-аналитик". Он
предназначен для юристов-профессионалов. В нее вошло более
пятидесяти тысяч нормативных актов рф и ее субъектов.
Программа позволяет пользователю создавать базы данных с
учетом его специализации, систематизировать,
классифицировать, регистрировать в системе подборки
документов по любым правоотношениям и автоматически их
обновлять. В "аналитик" также включены особые авторские и
профессионально ориентированные базы данных. В этой части
программы содержатся пояснения к существующему
законодательству, рассматриваются нетипичные правовые
ситуации и пути их разрешения.
Специфика работы с текстами нормативных актов россии
заключается в том, что эти документы в ряде случаев содержат
сведения отсылочного характера типа "руководствоваться
нормами действующего законодательства" или "в соответствии с
действующим законодательством". Пользователь информационно-
справочной базы "юсис" может получить полный список
документов, в которых поясняется содержание такого фрагмента
текста.
Следует отметить "интеллектуальную" функцию "юсис",
связанную с необходимостью для пользователя постоянно
отслеживать изменения в действующем законодательстве,
касающиеся специфики его работы. Система, "помня" все
интересующие пользователя проблемы (в виде сформированных им
словосочетаний), в дальнейшем будет автоматически предлагать
новые документы, в которых отражается актуальная для него
проблематика, при каждом обновлении баз данных.
Мы рассмотрели лишь общие принципы построения систем
обработки запросов в справочно-поисковых системах.
Представляется, что новые технологии работы с большими
объемами документов становятся все более актуальными, так
как сегодня в россии в сферу предпринимательства вовлекаются
все новые и новые слои населения, нуждающиеся в
своевременном получении правовой информации.
М. Львова
юридическое информационное агентство intralex