Заявки разбиваются на фрагменты следующим образом:- Сам текст заявки является первой фразой диалога.
- Алгоритм поочередно добавляет фразу за фразой к фрагменту, пока длина фрагмента укладывается в заданный размер фрагмента.
- Когда фрагмент упирается в предельный размер, начинает создаваться следующий фрагмент для данной заявки.
При разбиении заявок на фрагменты играет роль настройка «Максимальное число токенов в одной фразе». Если фраза в диалоге превысит это значение, то она обрезается до размера, примерно соответствующего этой настройке.
В данном случае настройки размера блока контекста и размера фразы работают совместно – чем больше размер блока контекста (фрагмента) и чем меньше размер фразы, тем больше фраз поместится в один фрагмент.
Но при этом, чем меньше заданный размер фразы, тем больше фраз будет обрезано; чем больше размер блока контекста, тем меньше таких блоков будет отправлено при запросе к нейросети.
Подробнее о формировании суммарного контекста, направляемого вместе с запросом к нейросети, будет описано в следующих инструкциях.