Словарь содержит главную часть языка – названия природных феноменов, но язык – это не только словарь. Синтаксис – это набор правил, по которым слова могут составлять предложения. В резульнате, описательные возможности существенно возрастают. Это чистая комбинаторика. Предположим, вы имеете предложение из 3 слов и всего 100 слов в словаре. Полное число комбинаций всех со всеми будет 1000000. С другой стороны, именно здесь может быть скрыта большая наука. Образы тоже могут создаваться по принципу «от общего к частному» и «от частей к целому». Если предмет представлен отдельным существительным, его можно рисовать черно-белым.
Как только вы добавляете прилагательное, обозначающее цвет, это соответствует выполнению команды «переключи все пиксели <предмета> в <цвет>».
Форматы внутреннего и языкового представлений сильно различаются. Как они соответствуют друг другу? Подобно цифровой электронике, формат образов – цифровой. Как сетчатка глаза,
так и серое вещество мозга
состоят из нейронов.
Между тем, образы сами по себе – аналоговые. Даже черно-белые картинки имеют градации серого с плавным переходом от света к тени. Напротив, язык очевидно дискретный, так что необходимо преобразование. Подобная трансформация широко используется в технике, но это аналого-цифровое преобразование. Аналого-дискретное – это другое. Какие методы можно предложить?
Естественный язык имеет числительные, так что возможны параметрические методы. Предположим у вас есть имя «эллипс» с числовым параметром эксцентриситета. Вы можете постепенно менять форму от прямой линии до круга.
Подобно этому, дискретные параметры могут задавать подклассы. Представьте бетонное одноэтажное здание. Теперь пусть это будет бревенчатая изба. Теперь – небоскреб. Это разные варианты дома. Оцифровка также используется, только с небольшим числом градаций. Например, видимый свет имеет непрерывный спектр. Любая длина волны возможна из определенного диапазона, но язык делит их на несколько дискретных цветов.
Частотные методы также возможны. Предположим, есть текст, по которому разбросаны 2 имени. О ком этот текст? Посчитайте число каждого и сравните. Если вы измените их частоту, ответ может измениться соответственно.
В конце концов, образы были реализованы в программировании через Объектно-Ориентированную парадигму. Подобный подход явно присутствует и в естественном языке. C++ ввел объекты, но их прототипы уже были в C как тип данных ’struct’.