Книга: «RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecon»

Новости

22.07.2025

Книга: «RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecon»

В книге описываются приемы создания эффективных больших языковых моделей, систем компьютерного зрения и генеративного ИИ, показывающих высокую производительность при относительно невысоких затратах. В ней приводится подробное исследование технологии RAG, а также подходов к проектированию мультимодальных пайплайнов ИИ и управлению ими. Связывая вывод с исходными документами, RAG повышает точность и контекстную релевантность результатов, предлагая динамический подход к управлению большими объемами информации.

Узнайте, как построить инфраструктуру RAG, попутно разобравшись с векторными хранилищами, фрагментацией, индексацией и ранжированием. Познакомьтесь с методами оптимизации производительности и приемами более глубокого изучения данных, включая использование адаптивного RAG и обратной связи от человека для уточнения поиска, тонкую настройку RAG, реализацию динамических RAG для поддержки принятия решений в реальном времени и визуализацию сложных данных с помощью графов знаний. Вы также увидите, как на практике объединить такие фреймворки, как LlamaIndex и Deep Lake, векторные базы данных наподобие Pinecone и Chroma и модели, предлагаемые компаниями Hugging Face и OpenAI. Приобретите навыки внедрения интеллектуальных решений, что повысит вашу конкурентоспособность в различных областях: от продакшена до обслуживания клиентов
в любом проекте.

Вы научитесь:

масштабировать пайплайны RAG для эффективной обработки больших наборов данных;
минимизировать галлюцинации и обеспечивать точность ответов;
применять методы индексации для улучшения точности ИИ и объяснимости результатов;
настраивать и масштабировать генеративные системы ИИ на основе RAG в разных областях;
использовать Deep Lake и Pineсone для быстрого и эффективного извлечения данных;
создавать надежные генеративные системы ИИ, основанные на данных из реального мира, и управлять ими;
объединять текстовые и графические данные для получения от ИИ более насыщенных и информативных ответов.

Об авторе и научном редакторе издания

Дэнис Ротман (Denis Rothman) окончил Парижский университет и Университет Париж Дидро. Будучи студентом, он написал и запатентовал одну из первых систем векторного представления слов word2vector и токенизации их фрагментов. Он организовал компанию, занимающуюся внедрением ИИ, и создал один из первых интеллектуальных NLP-ботов, который применялся для обучения языку в винодельческом доме Moët et Chandon (является частью Louis Vuitton Moët Hennesy) и других крупных компаниях. Дэнис быстро стал экспертом по объяснимому ИИ (explainable AI), занимаясь внедрением доступных интерфейсов и информации, проясняющей работу ИИ, в решения, создаваемые для аэрокосмической отрасли, швейной промышленности и пр. Он абсолютно уверен, что полноценно освоить какую-либо тему можно, только обучая других.

Дмитрий Бардин — ведущий разработчик, архитектор решений, один из авторов курса «Архитектор ПО» от «Яндекс Практикума». В настоящее время занимается разработкой бэкенда «КиноПоиска» с применением языков Go и Java. В прошлом руководитель службы продуктовой разработки и ресурс-менеджер. Опыт в ИТ — более 15 лет.

Ключевые темы книги

Глава 1: Почему именно генерация с дополненной выборкой

В первой главе автор знакомит читателя с базовыми концепциями RAG, подчеркивает ее адаптируемость под различные типы данных и разбирает сложности интеграции фреймворка RAG в существующие ИИ-платформы. К ее концу вы уже будете хорошо понимать, что такое RAG, приобретете практический опыт создания различных конфигураций для простых, продвинутых и модульных систем RAG с помощью Python и будете готовы к более сложным случаям их применения, рассматриваемым в последующих главах.

Глава 2: Сохранение эмбеддингов RAG с помощью Deep Lake и OpenAI

Здесь рассматривается процесс преобразования сырых данных в структурированные векторные хранилища. Автор показывает, как использовать модели Activeloop Deep Lake и OpenAI для создания и управления эмбеддингами. Читатель научится строить масштабируемые мультимодальные пайплайны RAG на Python, разделяя экосистему RAG на независимые компоненты для эффективной обработки больших датасетов с использованием продвинутых возможностей извлечения данных, что позволит улучшить результаты выдачи генеративных ИИ-моделей с помощью встраиваемых векторов документов.

Глава 3: Реализация индексированной RAG с помощью LlamaIndex, Deep Lake и OpenAI

Эта глава посвящена повышению точности и скорости работы моделей ИИ за счет индексирования. Интеграция в системы LlamaIndex, Deep Lake и OpenAI позволяет создавать трассируемые пайплайны. На примерах демонстрируется, как оптимизировать извлечение релевантной информации и улучшать качество выдаваемых результатов.

Глава 4: Мультимодальная RAG

Автор поднимает планку, переходя от текстовых данных к мультимодальным решениям при помощи фреймворка RAG, созданного специально для технологических решений в сфере беспилотных летательных аппаратов. Здесь начинается разработка системы генеративного ИИ, которая обрабатывает текстовую информацию и включает в себя продвинутые возможности распознавания изображений. Используя LlamaIndex, Deep Lake, OpenAI, читатель научится создавать мультимодальные системы RAG на базе Python, способные генерировать развернутые ответы на запрсы с учетом контекста.

Глава 5: Повышение эффективности RAG за счет обратной связи от эксперта

В этой главе описывается адаптивная RAG, где обратная связь от человека интегрируется в цикл обучения. На Python создается гибридная система, которая непрерывно уточняет данные, повышая релевантность и точность ответов.

Глава 6: Масштабирование банковских данных клиентов в системе RAG с помощью Pinecone

Практический кейс: разработка рекомендательной системы для снижения оттока клиентов банка, начиная с получения и анализа данных на примере датасета Kaggle. Читатель научится создавать эмбеддинги и обновлять/вставлять большие объемы данных через Pinecone и OpenAI, разработав рекомендательную систему с использованием GPT-4o.

Глава 7: Создание масштабируемой RAG на основе графа знаний с помощью API Википедии и LlamaIndex

Здесь читатель ознакомится с разработкой трех пайплайнов: сбора данных из Википедии, заполнения векторной БД Deep Lake и реализации RAG на основе индексируемого графа знаний. Глава охватывает автоматизирование извлечения и подготовку данных, создание и опрос граф знаний для визуализации сложных связей между этими данными, а также улучшение генерируемых ИИ ответов структурированной информацией.

Глава 8: Динамические RAG с помощью Chroma и Hugging Face Llama

Используя Chroma и Hugging Face Llama, автор объясняет, как создавать и управлять временными датасетами, обеспечивая высокую точность и актуальность информации.

Глава 9: Улучшение моделей ИИ: тонкая настройка данных RAG и обратная связь

Глава посвящена техникам тонкой настройки, используемым для систематизации данных RAG. В ней акцент будет сделан на том, как трансформировать обширные, непараметрические, сырые данные в более управляемый параметрический формат с обучаемыми весами, подходящий для непрерывного взаимодействия с ИИ.

Глава 10: RAG для создания стоковых видео с помощью Pinecone и OpenAI

Финальная глава посвящена интеграции RAG в генерацию видеоконтента. Читатель узнает, как OpenAI и Pinecone могут использоваться для автоматического создания, комментирования и разметки видео, расширяя творческие возможности за счет ИИ.

Ознакомиться с книгой «RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecon» можно на нашем сайте.