Я начал работу над собственным классификатором, и прорисовал его графически для простоты представления в powerpoint, и на первом этапе это выглядело, как на рисунке 10.
Рис. 10. Графический пример ветвлений в начале классифицирования неживого (слева) и живого (справа).
(Левая часть рисунка – это часть классификатора наиболее разветвленного, «Неживого»). С правой частью особых проблем испытывать не пришлось, спасибо биологам и ботаникам, которые хорошо потрудились над проработкой классификации царства животных и растений.
Из рисунка видно, что схема кажется очень сложной, и запутанной, хотя здесь всего лишь около 150 базисных наименований. К моменту написания этих строк число основных объектов в базе данных рабочей программы уже составляет около 3000 (Продолжая работу по расширению ядра классификатора с использованием морфологии и толкового словаря это число уже приблизилось к 60 000 слов, но эта история достойна отдельной книги. Прим. автора ко второму изданию). И хотя эта схема еще слишком проста для классификации «ВСЕГО», но уже слишком сложна, чтобы изобразить ее в виде подобного двухмерного рисунка. В будущем мы обязательно это нарисуем.
Кстати говоря, мне очень импонирует, что эта схема чем-то напоминает человеческий мозг (рис. 11). Или мне кажется? Но это несущественный вопрос.
Рис. 11. Если разветвленную структуру «классификатора всего» «упаковать» в небольшом объеме, то он мог бы получить сходство со схематичным мозгом.
В принципе, нам и не нужно разбираться в сложностях классификатора, за нас это будет делать компьютерная программа.
Новые понятия в этот классификатор добавляются очень просто, с использованием легкой конструкции объяснений, к какому объекту какой принадлежит.
Посмотрим, как выглядит часть записей словаря «боевой» программы на рисунке 12.
Рис. 12. Фрагмент кодирования в словаре «боевой» (но все же, тестовой) программы.
Сохраняя новые и новые объекты и их коды в базу данных, мы получаем структуру, обладающую огромным потенциалом, которую я назвал «Многомерным строчным множеством» или «Multidimensional Strings Multiplicity» (англ.). (Сокращенно, можно использовать аббревиатуру MSM или «слово-множество»).