4. История диалога (Если критична): Не вся история, а резюме ключевых моментов или только последние релевантные реплики. Размещение: Перед текущим запросом.
PRO стратегия: Использовать разделители и явные метки для каждого слоя.
RAG (Retrieval-Augmented Generation) для промт-инженера:
Суть: Динамическое извлечение релевантных фрагментов информации из внешних источников (БД, векторное хранилище, документы) и вставка их в контекст промта перед генерацией ответа.
Как интегрировать в промт:
Явная инструкция: "Используй ТОЛЬКО информацию из предоставленных 'ФАКТОВ' ниже для ответа на вопрос. Если ответа нет в фактах, скажи 'Недостаточно данных'."
Структура: `ВОПРОС: … ФАКТЫ ИЗ БАЗЫ ЗНАНИЙ: [текст, извлеченный RAG-системой] ИНСТРУКЦИЯ: Ответь на ВОПРОС, используя только ФАКТЫ.`
PRO нюансы: Инструкции по обработке противоречий в извлеченных фактах, указание источников.
Управление длинным контекстом (128K+):
Проблемы: Потеря фокуса модели на середине контекста, высокая стоимость, шум.
Техники:
Резюмирование: "Перед анализом документа, резюмируй его основные тезисы в 5 пунктов. Используй это резюме как контекст для дальнейших вопросов."
Приоритезация: "В предоставленном отчете сосредоточься В ПЕРВУЮ ОЧЕРЕДЬ на разделах 'Риски' и 'Рекомендации'. Остальные разделы используй как справочную информацию при необходимости."
"Окна внимания": "Для ответа на вопрос '[вопрос]' найди и выдели В ОТДЕЛЬНЫЙ БЛОК 2-3 наиболее релевантных абзаца из документа. Используй ТОЛЬКО этот блок для генерации ответа." (Может реализовываться через RAG).
Иерархические цепочки: Разбить обработку большого документа на последовательные шаги, передавая между шагами только резюме или ключевые выводы.