КЛАССИФИКАЦИЯ
(системно-морфологический подход)

Кузнецов С.В., Титов В.В.

5. Анализ некоторых классификаторов

Практически в каждой отрасли человеческой деятельности используются те или иные классификаторы. Систематические библиотечные классификации, многочисленные классификации товаров, классификации отраслей знания, классификации объектов интеллектуальной собственности, классификации изделий промышленности (станков, приборов, деталей, инструмента, и т.д.), классификации должностей и званий, классификации нормативных актов, классификация химических соединений, классификация животных, и так далее, перечень можно продолжать бесконечно.

Что общего у всех этих классификаций? Прежде всего то, что почти все они формировались стихийно, без жесткого алгоритма процедуры развития. Многие из классификаций имеют уже очень солидный возраст (например, классификация животного мира, созданная Линнеем, живет уже несколько веков), а количество любых классифицируемых объектов имеет тенденцию со временем только увеличиваться, разнообразие их - тоже. Поэтому классификатор - развивающаяся система, и это развитие совершается усилиями самых разных людей, отнюдь не всегда обращающих внимание на такие “мелочи”, как правила логического деления.

Результатом этого является наличие ошибок логического деления и, как следствие, основной дефект многих классификаторов - перекрытие ячеек классификатора и неизбежная неоднозначность выбора ячейки для очередных классифицируемых объектов. Финалом же этой цепочки следствий является то, что пользователь не сможет найти интересующий его объект иногда просто из-за того, что он лежит не там, где его ищут.

Рассмотрим конкретные классификаторы, наиболее часто используемые в человеческой деятельности.

 

5.1. Классификаторы отраслей знания

Если взять любой вузовский учебник по конкретной науке. то его оглавление почти всегда может служить классификатором областей знания в данной науке. Например, есть учебник “Общая физика”, но есть и учебник “Оптика”, а есть и учебное пособие “Волновая оптика”. На примере этих трех книг можно продемонстрировать вложенность классификаций: в учебнике общей физики есть раздел “Оптика”, в учебнике оптики есть раздел “Волновая оптика” (а по некоторым аспектам волновой оптики есть монографии, в которых также имеются свои оглавления, еще более углубляющие классификацию знаний).

Знания интересуют людей по разному. И классификаторы отраслей знания могут служить разным целям. Чаще всего, конечно, справочным, поисковым: знать все невозможно, но знать, где лежат нужные в данный момент знания, можно и нужно. Поэтому в научных библиотеках, например всегда есть не только алфавитный каталог (как уже говорилось раньше, алфавитный принцип - самый искусственный при классификации), но и - обязательно! - систематический, упорядоченный именно по темам, по отраслям знаний. Существует довольно много классификаций отраслей знаний, начнем обзор с самой главной - Универсальной десятичной классификации.

 

5.1.1. Классификатор УДК

Хотя эту аббревиатуру из трех букв УДК каждый встречал десятки и сотни раз (поскольку каждая статья и каждая книга снабжаются кодом УДК), мало кто знает, на каких принципах основана эта классификация. Существует она более 90 лет (первое сводное издание вышло в 1905 году), работало и работает над ее модификацией практически все мировое сообщество, в результате получилась мощная всеобъемлющая система, описать которую лучше, чем это сделано в самом классификаторе [4], невозможно. поэтому мы просто приведем оттуда развернутую цитату.

“... Универсальная десятичная классификация в целом характеризуется несколькими основными свойствами. Само название говорит о двух из них: универсальности и десятичности. Кроме того, следует отметить многоаспектность, как заложенную в структуре основной таблицы, так и возникающую при применении вспомогательных таблиц и приемов образования индексов, несущих в себе элементы стандартизации.

В многочисленных разделах этой системы упорядочено множество понятий по всем отраслям знаний или деятельности. Иными словами, УДК охватывает весь универсум знаний. При этом УДК не является конгломератом отдельных отраслевых классификаций. Хотя разделы классификации, соответствующие отдельным отраслям, отличаются по своей внутренней структуре, определяемой спецификой отрасли, система воспринимается как единое целое, благодаря существованию единого иерархического кода, общих правил построения индексов и непременному показу взаимосвязей данного раздела и его зависимости от других с помощью методического аппарата (“смежные области”, “ссылки”). УДК универсальна и в применении. Благодаря обилию средств и приемов индексирования, легко сокращаемой дробности, она успешно применяется для систематизации и последующего поиска самых разнообразных источников информации в различных по объему и по назначению фондах - от небольших узкотематических собраний специальной документации до крупных отраслевых и многоотраслевых справочно-информационных фондов

Универсальная десятичная классификация построена по систематическому принципу.

В УДК один и тот же предмет встречается в разных местах в зависимости от отрасли знания и от аспекта, в котором он рассматривается. Например, “нефть” встречается в нескольких разделах. В разделе 547 Органическая химия мы находим понятие “Химия нефти”; в 553 Месторождения полезных ископаемых - “Месторождения нефти”; в 622 Горное дело - “Добыча нефти”; в 662 Взрывчатые вещества. Топлива - “Нефть в качестве топлива” и т.д.

Такое явление, называемое множественной локализацией понятий, отражает многоаспектность УДК как свойство, заложенное в самой структуре схемы классификации. Это свойство всегда нужно иметь в виду при индексировании по УДК.

Многоаспектное индексирование содержания документов и запросов обеспечивается, кроме самой структуры УДК, использованием общих и специальных определителей, отражающих время, место, язык, параметры, оборудование, процессы и т.д., а также применением некоторых правил комбинирования индексов.

Одной из главных отличительных особенностей УДК является иерархическое построение большинства разделов основной и вспомогательных таблиц по принципу деления от общего к частному с использованием цифрового десятичного кода. Универсум знаний делится по аналогии с десятичными дробями.

Каждый класс (первая ступень деления) содержит группу более или менее близких наук, например, класс 5 - математику и естественные науки, класс 6 - прикладные науки; технику, сельское хозяйство. медицину.

Последующая детализация идет за счет удлинения индексов.

Индексы УДК построены так, что каждая последующая присоединяемая цифра не меняет значения предыдущих, а лишь уточняет, обозначая более частное понятие. Например, индекс понятия “Химическая коррозия” 620.193.4 складывается следующим образом:

6 Прикладные науки
62 Инженерное дело. Техника в целом
620 Испытания материалов. Товароведение
620.1 Испытания материалов. Дефекты материалов. Защита материалов
620.19 Дефекты материалов и их выявление. Коррозия
620.193 Коррозия. Коррозионная стойкость
620.193.4 Химическая коррозия. Воздействие различных агрессивных сред

Как уже было сказано, по иерархии от общего к частному построены не только основная, но и вспомогательные таблицы общих и специальных определителей, например,

Специальные определители
62-6 Регулирование и управление машинами и процессами
62-55 Регуляторы
62-555 Регуляторы. приводимые в действие посредством физических процессов
62-555.5 посредством излучения
62-555.56 селеновых фотоэлементов
Общие определители точки зрения
.004 Аспект применения, эксплуатации, употребления
.004.6 Изменения при применении, эксплуатации, употреблении. Восстановление
.004.67 Восстановление. Исправление. Улучшение. Ремонт

В настоящее время при детализации разделов цифра 0, как правило, не используется ввиду возможной путаницы со специальным определителем .0; цифра 9 обычно отводится для понятия “другие”, “прочие”. Таким образом, активно используются восемь цифр. В том случае, когда количество классифицируемых понятий превышает восемь мест в ряду, девятый раздел может дробиться дальше, а получаемые сотые (если нужно и тысячные) доли-индексы приравниваются по своему значению к десятым долям (так называемый октавный принцип).”

Описание общей методики работы с УДК занимает объем более 1,1 учетно-издат. листа плюс многочисленные таблицы общих и специальных определителей, но в сумме все это позволяет кодифицировать практически любой текст (от монографии до частного письма или багажной квитанции включительно), причем кодифицировать (при желании) настолько детально, что в некоторых случаях даже и читать-то такой текст уже нет необходимости, так как вся содержащаяся в нем информация полностью находится в коде.

Поскольку УДК сформирована с неукоснительным соблюдением правил классификации, перечисленных выше, то ей присуще и еще одно очень ценное свойство: эту классификацию легко усечь как сверху, так и снизу, т.е. либо напрямую использовать ее часть. посвященную конкретной области знания (с “отрезанием” левой части кода, выводящей за пределы нашей области знаний), либо ограничиться определенным уровнем детализации знаний и аспектов их представления (с игнорированием большей части дополнительной информации, кодируемой общими и специальными определителями), либо и то, и другое. Иными словами, УДК может служить в качестве “заготовки” для формирования любого не столь универсального классификатора.

Очень важным достоинством УДК является элегантное решение проблемы фасетной классификации с помощью системы определителей, этот принцип мог бы существенно упростить многие иные классификации, о чем еще будет речь дальше.

Однако не самым удачным воспринимается выбор условных обозначений для некоторых определителей (“.00” - для точек зрения, “-03” - материалы, “-05” - личные характристики, “(0...)” - форма документа, а также некоторые другие). Минимизация длины кода делает предпочтительной однознаковую индикацию служебных характристик кода, и таких знаков (например, букв латинского алфавита) вполне достаточно было бы для всего набора общих и специальных определителей УДК. Но традиция - великая сила (90 лет все-таки...), в результате эти многоместные индикаторы сохранились до сих пор.

 

5.1.2. Классификатор РФФИ

Крайне интересно в этом смысле проанализировать классификатор Российского фонда фундаментальных исследований [5], который по идее должнен бы представлять из себя усеченный снизу Универсальный десятичный классификатор (разделы 1 Философия. Психология, 3 Общественные науки, 5 Математика. Естественные науки, 9 География. Биографии. История).

Первое, что бросается в глаза при обозрении классификатора РФФИ, - это резкий крен в сторону естественных наук за счет общественных и в рамках естественных наук - столь же резкий крен в сторону наук о Земле. Вот структура классификатора РФФИ:

1. Математика, информатика, механика (3 раздела 2-го уровня, 46 разделов 3-го уровня).
2. Физика и астрономия (8 разделов 2-го уровня, 38 разделов 3-го уровня).
3. Химия (5 разделов 2-го уровня, 28 разделов 3-го уровня).
4. Биология и медицинская наука (3 раздела 2-го уровня, 23 раздела 3-го уровня).
5. Науки о Земле (7 разделов 2-го уровня, 96 разделов 3-го уровня).
6. Науки о человеке и обществе (9 разделов 2-го уровня без дальнейшей детализации).
7. Создание и развитие информационных, вычислительных и телекоммуникационных ресурсов для проведения фундаментальных исследований (4 раздела 2-го уровня, 23 раздела 3-го уровня).

Этот классификатор имеет не столько теоретическое значение, сколько сугубо практическое: именно в таком соотношении распределяются скудные средства на поддержку умирающей фундаментальной науки России. И печальный вывод о том, что общественные науки в нашем научном и властном сообществе обречены, влечет не менее печальный вывод о том, сколько времени нам еще придется блуждать в потемках экономических и политических экспериментов без понимания, что и зачем делать.

Да и в естественных науках ситуация не менее странна: базовые для высоких технологий фундаментальные науки (физика, химия, биология) в сумме не дотягивают до наук о земле - базовых для добывающих отраслей. Так что все это заставляет поставить очень неприятный вопрос: какую же глобальную цель преследуют те руководители Фонда, кто утвердил столь своеобразную селективность поддержки фундаментальной науки?

Таблица 1 .
Наименование раздела верхнего уровня классификатора Печатный объем перечня рубрик раздела УДК, страниц Число рубрик нижнего уровня классификатора РФФИ Нормированное соотношение объемов
Математика (+Механика) 4,55(+5,1)  
Математика, информатика, механика
46
4,3
Астрономия. Геодезия + Физика (—Механика)
4,15+2,8+16,2(—5,1)
1,9
Физика и астрономия
32+6
 
Химия
28
 
Химия. (Кристаллография. Минералогия)
25,2(+1+1,6)
1
Биология и медицинская наука 15+8  
Биологические науки + Ботаника + Зоология 4,6+4,45+8,7 1,17
Геология. Геологические и геофизические науки 10,15 8,6
Науки о Земле
96
 

Если принять в качестве исходного положения то, что пропорции развития разных отраслей фундаментальной науки должны приблизительно соответствовать количеству рубрик этих отраслей в УДК (ведь фундаментальные науки от конъюнктуры и местных условий практически мало зависят), то можно оценить, насколько классификатор РФФИ искажает реальное положение дел в науке. В таблице 1 показаны “объемные” пропорции разных наук в классификаторах УДК и РФФИ.

Отсутствие идентичности наименований рубрик в этих двух классификаторах не дает возможности назвать точные соотношения, в таблице это осуществляется добавлением или вычитанием объемов соответствующих подразделов. Тем не менее, очевидно, что РФФИ из всех естественных наук отдает явное предпочтение геологам и в меньшей степени - математикам, химики и биологи - в совершенном загоне, чуть лучше положение физиков.

С формальной точки зрения классификатор РФФИ тоже довольно ущербен. Попробуйте решить задачу: как сформулировать единственное основание деления, в результате которого получились бы семь разделов классификатора РФФИ первого уровня? Едва ли это удастся. Формально классификатор РФФИ представлен как чисто иерархический, хотя в нем невооруженным глазом просматривается неоднозначность (например, разделы 01-326 Динамика атмосферы и океана перекликаются с разделами 05-513 и 05-514 в океанологии и с разделами 05-610 и 05-612 в физике атмосферы), причем очевидно, что эта неоднозначность напрямую связана с насильственной попыткой фасетную классификацию втиснуть в прокрустово ложе иерархической. Подобных ошибок в классификаторе РФФИ достаточно.

Очевидная некорректность классификатора РФФИ (и по форме, и по сути) вынуждает поставить вопрос: а как мог бы выглядеть корректный классификатор фундаментальных наук? Не вдаваясь в детали конкретных рубрик нижнего уровня, можно сказать, что число рубрик нижнего уровня каждого из основных разделов классификатора РФФИ все-таки должно соответствовать объему соответствующих разделов УДК (еще лучше, если бы соответствовали и названия). Очевидно, что это будут в какой-то степени обобщающие рубрики, поэтому для каждой из них придется дать расшифровку объема.


Общие свойства классификаций

Оглавление

Международная классификация изобретений