КЛАССИФИКАЦИЯ
(системно-морфологический подход)

Кузнецов С.В., Титов В.В.


Заключение

Анализ множества классификаторов, существующих в обозримом информационном поле, позволяет сделать следующие выводы:

  1. Основные принципы классификации, изложенные в разделе 3 (единство основания деления, наличие ячейки “Прочие”, вложенность классификаторов), ни в одном из рассмотренных классификаторов в явном виде не декларированы.
  2. Принцип “от трех до семи” в неявной форме реализован в десятичных классификаторах, точнее, в той их части, где каждому разряду или этажу классификации отведено одно знакоместо в коде. Чаще всего этот принцип используется в наиболее “пожилом” классификаторе УДК.
  3. Во всех классификаторах разработчики предпочитают строить иерархическую структуру, смиряясь с фасетной только в уж совсем безвыходных положениях.
  4. Фасетные участки классификаторов организованы у разных разработчиков по разному. ВНИИКИ, например, просто преобразует фасетную часть (если она появляется) в иерархическую. В УДК введена система определителей, т.е. фактически независимых ветвей, довольно часто представляющих собой самостоятельные классификаторы солидного объема и значительной глубины. Разработчики системы ДИМОЛ [ 13 ] пошли по пути создания совершенно изолированных классификаторов вместо фасетного их объединения.
  5. Большинство классификаторов, утвержденных Госстандартом, имеют одно общее свойство: необозримое множество элементов на самом верхнем этаже деления. Как правило, верхний этаж кодируется двумя десятичными знаками, и не всегда этого набора хватает.
  6. Другое печальное общее свойство многих классификаторов связано с тем, что не соблюдено единство основания деления. В сочетании с чрезвычайно большим числом рубрик на конкретном этаже классификатора, бессистемным расположением объектов в перечне этих рубрик и необходимостью развития классификатора (т.е. добавления новых рубрик) это приводит иногда к таким несуразицам, как, например, размещение раздела Программное обеспечение между разделами Замочные и скобяные изделия и Бытовые приборы (классификатор ОКП).

Большинство классификаторов при их создании предназначалось для постоянной ручной работы с ними сравнительно узких специалистов, которые раньше или позже доводили до полного автоматизма нахождение тех немногих рубрик, с которыми они работали, вне зависимости от того, какие у этих рубрик “соседи по этажу”. Это позволяло мириться с неудобствами типа слишком большого количества рубрик на этаже, огрехами в выборе оснований деления (и соблюдения правила единственности основания) и бессистемностью в расположении рубрик.

Однако к настоящему времени ситуация существенно изменилась. Объем классифицируемой информации во многих случаях стал настолько велик, что ручная классификация становится очень дорогостоящей, т.к. требует большого количества занятых ею специалистов высокой квалификации, а цена ошибки в рыночных условиях стала реальным и очень важным фактором. С другой стороны, развитие информационных технологий достигло такого уровня, что рутинную работу по классификации можно было бы поручить машине. Но для этого существующие классификаторы практически непригодны, прежде всего из-за невозможности сформулировать запрос, отличающий например, объект, относящийся к классу упомянутого выше Программного обеспечения, от каждого из 93 остальных классов этого уровня (так как именно столько классов находится на верхнем этаже ОКП).

Таким образом, правило “от трех до семи” здесь приобретает совсем иное звучание: надо для каждого из членов деления данной группы сформировать уникальный перечень признаков, однозначно опознаваемых компьютером даже при условии, что объекты описываются обычным русским (или иным человеческим) языком с его синонимами, омонимами и эпитетами.

Алгоритмы распознавания текстов по смыслу уже существуют (на выставке Softool’87 демонстрировалась даже программа, автоматически составляющая реферат текстового файла), а задача различения объектов без подобного алгоритма нереализуема. Но без правила “от 3 до 7” она тем более нереализуема.

Поэтому на очереди стоит задача преобразования практически всех общероссийских классификаторов в тех областях, где текущее состояние дел требует надежной статистической обработки множества разнообразных данных. Как решать эту задачу и в какой последовательности модифицировать классификаторы, эти вопросы частично затрагивались в настоящей работе, но, конечно, они требуют более глубокой проработки, так как проблема по масштабу и ответственности сравнима с проблемой перехода Европы на единую валюту.

Другой аспект проблемы связан с узкой, но очень важной отраслью - правом. Проблема правовой реформы в России характризуется двумя ключевыми моментами: 1) приведение всего законодательства в самосогласованную непротиворечивую систему и 2) обеспечение свободного доступа граждан ко всей правовой информации. И то, и другое требует в первую очередь классификации всей уже имеющейся правовой информации, причем классификации однозначной и понятной не только юристам-жилищникам, например, но любому гражданину, не обремененному никаким юридическим образованием (в надежде, что в такой классификации разберется и юрист, специализирующийся по любой из многочисленных отраслей права). И здесь, безусловно, важным навигационным компасом может служить основание деления, в явной форме предложенное пользователю при каждом его шаге выбора среди 3-7 альтернатив. Поэтому в Приложениях к настоящей работе рассмотрена именно эта задача.


Литература.
1. А.А.Ивин. Искусство правильно мыслить. М., Просвещение, 1986.
2. В.Н.Садовский. Методологические проблемы исследования объектов, представляющих собой системы. В кн. "Социология в СССР". М., Наука. 1965.
3. В.В.Титов. Системный подход. М., ВНИИПИ, 1990.
4. Универсальная десятичная классификация. 1986.
5. См. газету "Поиск" № , 1986, с. 6-7.
6. Международная патентная классификация. ВНИИПИ, 1995.
7. Общероссийский классификатор общероссийских классификаторов (ОКОК). Утвержден Постановлением Госстандарта РФ 30.12.1995.
8. Общероссийский классификатор продукции (ОК 005-93) Введен в действие Постановлением Госстандарта РФ №301 от 30.12.1993.
9. Международная классификация товаров и услуг.
10. Товарная номенклатура внешнеэкономической деятельности. Второе издание (официальное). М., ГТК РФ, 1992.
11. Общероссийский классификатор отраслей законодательства (ОКОЗ). Введен в действие Указом Президента
12. Общероссийский классификатор управленческой документации (ОК 011-93). Утвержден Постановлением Госстандарта РФ №299 от 30.12.1993.
13. Отчет РНЦ "Курчатовский институт" по программе ДИМОЛ, 1998.


Классификаторы документации

Оглавление

Приложение 1