Об авторе и научном редакторе издания
Дэнис Ротман (Denis Rothman) окончил Парижский университет и Университет Париж Дидро. Будучи студентом, он написал и запатентовал одну из первых систем векторного представления слов word2vector и токенизации их фрагментов. Он организовал компанию, занимающуюся внедрением ИИ, и создал один из первых интеллектуальных NLP-ботов, который применялся для обучения языку в винодельческом доме Moët et Chandon (является частью Louis Vuitton Moët Hennesy) и других крупных компаниях. Дэнис быстро стал экспертом по объяснимому ИИ (explainable AI), занимаясь внедрением доступных интерфейсов и информации, проясняющей работу ИИ, в решения, создаваемые для аэрокосмической отрасли, швейной промышленности и пр. Он абсолютно уверен, что полноценно освоить какую-либо тему можно, только обучая других.
Дмитрий Бардин — ведущий разработчик, архитектор решений, один из авторов курса «Архитектор ПО» от «Яндекс Практикума». В настоящее время занимается разработкой бэкенда «КиноПоиска» с применением языков Go и Java. В прошлом руководитель службы продуктовой разработки и ресурс-менеджер. Опыт в ИТ — более 15 лет.
Ключевые темы книги
Глава 1: Почему именно генерация с дополненной выборкой
В первой главе автор знакомит читателя с базовыми концепциями RAG, подчеркивает ее адаптируемость под различные типы данных и разбирает сложности интеграции фреймворка RAG в существующие ИИ-платформы. К ее концу вы уже будете хорошо понимать, что такое RAG, приобретете практический опыт создания различных конфигураций для простых, продвинутых и модульных систем RAG с помощью Python и будете готовы к более сложным случаям их применения, рассматриваемым в последующих главах.
Глава 2: Сохранение эмбеддингов RAG с помощью Deep Lake и OpenAI
Здесь рассматривается процесс преобразования сырых данных в структурированные векторные хранилища. Автор показывает, как использовать модели Activeloop Deep Lake и OpenAI для создания и управления эмбеддингами. Читатель научится строить масштабируемые мультимодальные пайплайны RAG на Python, разделяя экосистему RAG на независимые компоненты для эффективной обработки больших датасетов с использованием продвинутых возможностей извлечения данных, что позволит улучшить результаты выдачи генеративных ИИ-моделей с помощью встраиваемых векторов документов.
Глава 3: Реализация индексированной RAG с помощью LlamaIndex, Deep Lake и OpenAI
Эта глава посвящена повышению точности и скорости работы моделей ИИ за счет индексирования. Интеграция в системы LlamaIndex, Deep Lake и OpenAI позволяет создавать трассируемые пайплайны. На примерах демонстрируется, как оптимизировать извлечение релевантной информации и улучшать качество выдаваемых результатов.
Глава 4: Мультимодальная RAG
Автор поднимает планку, переходя от текстовых данных к мультимодальным решениям при помощи фреймворка RAG, созданного специально для технологических решений в сфере беспилотных летательных аппаратов. Здесь начинается разработка системы генеративного ИИ, которая обрабатывает текстовую информацию и включает в себя продвинутые возможности распознавания изображений. Используя LlamaIndex, Deep Lake, OpenAI, читатель научится создавать мультимодальные системы RAG на базе Python, способные генерировать развернутые ответы на запрсы с учетом контекста.
Глава 5: Повышение эффективности RAG за счет обратной связи от эксперта
В этой главе описывается адаптивная RAG, где обратная связь от человека интегрируется в цикл обучения. На Python создается гибридная система, которая непрерывно уточняет данные, повышая релевантность и точность ответов.
Глава 6: Масштабирование банковских данных клиентов в системе RAG с помощью Pinecone
Практический кейс: разработка рекомендательной системы для снижения оттока клиентов банка, начиная с получения и анализа данных на примере датасета Kaggle. Читатель научится создавать эмбеддинги и обновлять/вставлять большие объемы данных через Pinecone и OpenAI, разработав рекомендательную систему с использованием GPT-4o.
Глава 7: Создание масштабируемой RAG на основе графа знаний с помощью API Википедии и LlamaIndex
Здесь читатель ознакомится с разработкой трех пайплайнов: сбора данных из Википедии, заполнения векторной БД Deep Lake и реализации RAG на основе индексируемого графа знаний. Глава охватывает автоматизирование извлечения и подготовку данных, создание и опрос граф знаний для визуализации сложных связей между этими данными, а также улучшение генерируемых ИИ ответов структурированной информацией.
Глава 8: Динамические RAG с помощью Chroma и Hugging Face Llama
Используя Chroma и Hugging Face Llama, автор объясняет, как создавать и управлять временными датасетами, обеспечивая высокую точность и актуальность информации.
Глава 9: Улучшение моделей ИИ: тонкая настройка данных RAG и обратная связь
Глава посвящена техникам тонкой настройки, используемым для систематизации данных RAG. В ней акцент будет сделан на том, как трансформировать обширные, непараметрические, сырые данные в более управляемый параметрический формат с обучаемыми весами, подходящий для непрерывного взаимодействия с ИИ.
Глава 10: RAG для создания стоковых видео с помощью Pinecone и OpenAI
Финальная глава посвящена интеграции RAG в генерацию видеоконтента. Читатель узнает, как OpenAI и Pinecone могут использоваться для автоматического создания, комментирования и разметки видео, расширяя творческие возможности за счет ИИ.
Ознакомиться с книгой «RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecon» можно на нашем сайте.
Комментарии: 0
Пока нет комментариев