Nodul LogoNodul
RAG-хранилище

AI Data Storage

RAG сейчас находится в бета-версии. Цены, поведение и ограничения могут измениться.

brave_gM7qog41yj.png

Назначение

AI Data Storage (RAG) — это компонент платформы Nodul, предназначенный для хранения и индексации текстовых файлов, изображений и других источников знаний.

Этот инструмент предназначен в первую очередь для использования совместно с ИИ-агентом — он предоставляет документы в виде чанков, которые агент затем может использовать для генерации ответов.

Варианты использования:

  • Загрузка и хранение структурированного или неструктурированного контента
  • Генерация векторных эмбеддингов для быстрого семантического поиска
  • Выполнение поисковых запросов на естественном языке
  • Подключение к узлу RAG Search внутри сценария

Как получить доступ

Вы можете получить доступ к этой функции через Data Storage → AI Data Storage (RAG) в левом меню.

brave_l3S0LYq3WK.png


Создание хранилища

Нажмите Create Storage, чтобы открыть окно настройки:

brave_awRQKmbKQs.png

Заполните обязательные поля: Storage Name, Chunk Size, Chunk Overlap

brave_nHbU4QmKzu.png


Что такое Chunk Size и Overlap?

  • Chunk Size — количество токенов в одном чанке. Меньшие чанки обеспечивают более высокую точность, но увеличивают общее количество чанков.
  • Chunk Overlap — процент перекрытия токенов между соседними чанками. Помогает сохранять контекст между ними.

Управление хранилищем

Созданные хранилища отображаются в таблице:

brave_R2vB1tRsYc.png

ПолеОписание
NameНазвание хранилища
Chunk SizeКоличество токенов на чанк
Chunk OverlapПерекрытие между чанками в %
CreatedДата создания
UpdatedДата последнего обновления

Загрузка файлов

Откройте хранилище для доступа к интерфейсу загрузки. Поддерживается перетаскивание файлов.

brave_B5v1L58izT.png

После загрузки:

  • Каждый файл обрабатывается и индексируется (статус: Processing)
  • Файлы отображаются с размером, датой загрузки и статусом
  • Редактирование или скачивание файлов в настоящее время не поддерживается

brave_5f8Vn9IysJ.png


Мультимодальные функции RAG

Для работы с изображениями и нетекстовыми данными RAG Storage использует продвинутый подход:

  • Автоматическое описание изображений: При загрузке изображений (JPEG, PNG) система автоматически генерирует их текстовое описание (краткое содержание) с помощью мультимодальной LLM и индексирует это описание вместе с текстовым контентом.
  • Индексация текста: Текст, извлечённый через OCR из изображений (или PDF-файлов), также разбивается на чанки и индексируется.

Это позволяет ИИ-агенту эффективно находить ответы на вопросы на основе как текстового, так и визуального контента.


Функции и ограничения

ФункцияСтатус
OCRПоддерживается (английский и русский)
Загрузка изображенийПоддерживается (если изображение содержит текст)
Редактирование файловНе поддерживается
Скачивание файловПока недоступно
Автоматическая индексацияДа
Поддерживаемые форматыPDF, TXT, JSON, MD, PNG, JPG и другие
Загрузка через сценарийПока не поддерживается

Технические детали

ПараметрЗначение
Максимальный размер файла20 МБ (планируется 50 МБ)
Лимит векторов5 000 000 векторов на аккаунт
Тарификация0.0066 PNP токенов за страницу, списание только при загрузке файла

Тарификация

  • PNP токены списываются при загрузке файла
  • Тарификация основана на страницах/чанках
  • Стоимость векторизации: 0.0066 PNP токенов за страницу
  • "1 страница" соответствует примерно 1000 словам или 5000 символам текста
  • Для неструктурированных данных (например, TXT, MD) применяется та же линейная модель тарификации — стоимость пропорциональна общей длине текста

Примеры:

  • 10 страниц (PDF/DOCX/PPTX) → 0.066 PNP токенов ($0.066)

  • TXT ≈ 10 000 слов (≈ 50 000 символов) → 0.066 PNP токенов ($0.066)

  • MD ≈ 20 000 слов (≈ 100 000 символов) → 0.132 PNP токенов ($0.132)

  • 100 страниц → 0.66 PNP токенов ($0.66)

  • Запросы через RAG Search дополнительно не тарифицируются