Методы автоматизации учрежденийРассмотрим основные методы автоматизации учрежденческой деятельности. Современные организации представляют собой совокупность подразделений, филиалов, отделов и офисов, обменивающихся между собой информацией и выполняющих отдельные части общей работы. Основными фазами жизни неструктурированной информации в офисе являются(Рис.1): • ввод информации в систему, • хранение, навигация, поиск и фильтрация документов, • коллективного работа с документами, • вывод информации из системы.
Рис.1.Функциональная схема управления электронными документами. Существуют различные способы ввода данных в систему. Это, прежде всего, сканирование документов и сохранение их в виде графических образов. В системах первого поколения они идентифицируются с помощью ключевых слов для последующего поиска необходимой информации (например: система SoftSolutions). Позднее стала применяться технология оптического распознавания символов OCR (Optical Character Recognition). После сканирования и ввода документа его графический образ "переводится" в текст с последующим исправлением ошибок распознавания. При массовом наборе однотипных документов используются электронные формы, которые обеспечивают структуризацию документа путем выделения частей текста и добавления полей (атрибутов), что позволяет упростить заполнение документов и выполнить необходимые вычисления. Информация в офис поступает и путем импорта файлов с магнитных носителей или по внешним телекоммуникациям (факсы, сообщения электронной почты и т.п.). Внесение данных сопровождается классификацией документов путем задания атрибутов и ключевых слов, аннотированием их содержания. При этом для ускорения последующего контекстного поиска производится полнотекстовое индексирование документов. Важное значение для организации эффективного управления неструктурированными документами имеют методы хранения информации, навигации, поиска и фильтрации документов.(Табл.1) Методы хранения информации, навигации, поиска и фильтрации документов Схема хранения Навигация Поиск и фильтрация Файловая система Каталоги и папки По именам и параметрам файлов Почтовые ящики Личные и коллективные папки По атрибутам и тексту сообщения База документов (Lotus Notes) Страницы, базы документов и категории По атрибутам и тексту сообщения Библиотеки документов Проекты(папки) По атрибутам, ключевым словам и тексту Гипертекст Гиперссылки По гипертексту Текстовая база данных Таблицы и представления По атрибутам и тексту Универсальная база данных Таблицы и представления По атрибутам и бинарным объектам Документы могут храниться просто в файловой системе, и при этом система каталогов служит средством группирования и навигации в хранилище документов. В современных ОС типа Windows 95 реализованы функции задания длинных имен каталогов и файлов в качестве названий папок и документов. Ряд систем, основанных на электронной почте, хранят документы в почтовых ящиках в виде сообщений с присоединенными файлами. Навигация упрощается с помощью папок личного и коллективного пользования. Однако их поиск и фильтрация ограничены лишь отбором и сортировкой по атрибутам и тексту. Специфический метод хранения реализован в пакете Lotus Notes в виде так называемой базы документов, в состав которой входит как однотипная, так и разнотипная информация, сохраняемая в одном файле. Документы допускают внутреннюю структуризацию на основе формуляров путем выделения и добавления в них полей. Навигацию в базе упрощает наличие страниц и категорий. Многие современные системы в дополнение к файловой системе используют библиотеки документов, содержащие в БД их карточки с атрибутами и ключевыми словами. Поиск и фильтрация производится по запросам на основе контекстного поиска: по атрибутам, по ключевым словам и по полному содержанию текста на основе индекса(Рис.2).
Рис.2. Классификация методов информационного поиска.
При использовании механизма четкого поиска (например, DOCS OPEN) в запросе не должно быть орфографических ошибок, а в тексте документа - неточностей распознавания. Морфологический разбор позволяет упростить формирование запросов и улучшить отбор информации. Реализация на основе нейронных сетей и искусственного интеллекта технологии нечеткого поиска по полному содержанию документа (например, технология адаптивного распознавания образов APRP в пакете Excalibur EFS) не требует идентичности искомых фраз содержимому файла и, кроме того, исключает потребность в исправлении ошибок после распознавания текста.Результаты выборки при этом наилучшим образом согласованы с терминами или фразами запроса пользователя. Фирмы-производители реляционных СУБД (в частности ORACLE) проповедуют другие схемы хранения - текстовые и универсальные базы данных (БД). При этом тексты документов располагаются в символьных полях переменной длины,а расширенные средства SQL-поиска формируют смешанные запросы. Для хранения произвольной информации, в том числе мультимедиа, используются поля бинарных объектов большой длины BLOB и/или гипертекст. Феномен распределенного гипертекста составляет основу широко внедряемой Web- технологии. Хранилище информации представляет собой совокупность гипертекстовых страниц, распределенных по узлам сети Internet или корпоративной сети (Intranet). Каждая страница размещается в отдельном файле и представляет собой текст, размеченный с помощью языка HTML. Структуризация документа проводится путем форматирования, выделения полей, создания форм для диалогового заполнения документа и гипермедиа (включением любой мультимедиа-информации:растровая графика, аудио, видео), а также путем организации внутренних ссылок. Навигация по хранилищу гипертекста осуществляется с помощью внешних гипертекстовых ссылок URL на документы, расположенные на различных узлах сети (Web-серверах).Для контекстного поиска. в "паутине" задействованы специальные программы-роботы, сканирующие Web- сервера и строящие некое подобие индекса. Использование гипертекста позволяет создать информационную инфраструктуру территориально распределенного учреждения и упростить диалоговый интерфейс пользователя. Организация и автоматизация в офисе коллективной работы с документами строятся на технологиях groupware и workflow. Методика groupware ориентирована на небольшие рабочие группы для поддержки выполнения одной коллективной задачи при отсутствии дополнительной организационной структуризации, которая ограничивается обеспечением коллективного входа с помощью различных методов доступа: • сетевой доступ к файлам и базе данных; • локальная и глобальная электронная почта (включая конференции и дискуссии); • терминальный доступ, пересылка файлов и электронная доска объявлений; • просмотр и интерпретация гипертекста (гипермедиа).
В процессе коллективной работе важно наличие блокировок для разрешения конфликтов при совместном использовании ресурсов, санкционирование входа по идентификаторам и паролям, защита информации с помощью прав доступа. Дополнительный уровень безопасности поддерживается методами и средствами шифрации и электронной подписи. Технологии класса workflow служат для автоматизации документооборота в средних и крупных офисах и для них характерно: • поддержка многопользовательской работы с несколькими задачами одновременно; • четкая структуризация выполнения работ по ролям и документам с контролем исполнения. Деловой процесс формализуется как совокупность состояний и переходов, необходимых для описания взаимодействия, как минимум двух субъектов (в частном случае сотрудников предприятия), для выполнения заранее заданного условия. Например, простая пересылка документа из точки в точку. Одним из вариантов реализации технологии workflow является так называемая "система графов"(Рис.3), где каждый шаг представляет собой вектор и отражает движение задания, связанного с конкретным файлом, или просто передвижения документа от одного субъекта к другому.
Рис.3. Векторный способ описания документооборота в Staffware.
При этом на сотрудника, отвечающего за правильность функционирования схемы, ложится ответственность учета всевозможных непредвиденных (или отказных) ситуаций, которые могут возникнуть в процессе исполнения задания. Другая модель основана на понятии "цикл" ("loop") или "стол"(Рис.4).
Рис.4.Способ описания документооборота на основе циклов в Action Worflow.
В этом случае наименьшим элементом схемы является цикл, учитывающий всю гамму взаимодействия двух произвольных субъектов. Система сама отслеживает замкнутость и корректность этого процесса. Регламентация взаимоотношений субъектов информациооного обмена дополняется заданием безусловной и условной маршрутизации файлов (по электронной почте) и времени их обработки
|