Таким образом, в этой брошюре я опишу большие языковые модели, которые построены на основе архитектуры нейронных сетей. Эти модели обучены посредством машинного обучения и представляют собой вид искусственного интеллекта – компьютерной системы, предназначенной для решения человеческих задач.
Как работает большая языковая модель?
Как функционирует большая языковая модель? Опущу техническую часть про векторы и матрицы (в конце концов, мы все здесь гуманитарии). Главное, что нужно знать: языковая модель – мощный механизм предсказания ответов на ваши вопросы. Звучит здорово, правда? Ведь когда мы задаем вопрос, то хотим именно этого: получить ответ.
Однако есть принципиальная разница: модель предсказывает не обязательно правильный ответ, а наиболее вероятный. Модель оценивает вероятность того или иного ответа и выбирает вариант, который статистически чаще соответствует подобным запросам в её обучающих данных. Как вы понимаете, это не всегда правильный ответ.
Например, вы спрашиваете модель по поводу химии. Или медицины. Или теории полета. Если вы не специалист, то скорее всего не сможете отличить верный ответ от ошибочного. Современные модели умеют генерировать текст, который кажется правдоподобным, но это не гарантирует его фактической точности. Другими словами, в ответе может быть полная чепуха.
Такие ошибки – когда модель генерирует убедительный, но ложный ответ – называется «галлюцинациями» (да, это общепринятый термин). Галлюцинации связаны с тем, что для модели разница между верными и неверными ответами не бинарна: она оперирует вероятностями. Каждый ответ формируется как наиболее вероятная комбинация слов, а не как результат понимания смысла. Поэтому модель не может «осознать», что не знает ответа, и все равно предложит пользователю какой-то правдоподобный вариант.
Вероятность галлюцинаций увеличивается, если вы запрашиваете у ИИ редкую или малодоступную информацию, касаетесь сложных тем или преодолеваете явное нежелание модели отвечать на вопрос. При работе с ИИ важно иметь в виду, что он не владеет всей информацией в мире: например, он плохо ориентируется в старых книгах (которых нет в интернете), не знает исторических данных (например, недействующего законодательства СССР) и т. п.
Важно уметь выявлять галлюцинации модели, если вы планируете часто работать с ИИ. Также нужно формулировать вопросы нейтрально, то есть не подталкивать модель к тому или иному ответу.