Объемы данных растут экспоненциально, а опасность оказаться в «болоте данных» (data swamp) подстерегает на каждом шагу? Чтобы получить ценную аналитику, которая обеспечит конкурентное преимущество, можно обратиться к проверенной модели архитектуры медальона. Однако реализовать надежную архитектуру данных довольно сложно, особенно бронзовый, серебряный и золотой уровни. Опираясь на свой богатый практический опыт, Питхейн Стренгхольт развеивает распространенные заблуждения и объясняет сложные проблемы, с которыми вы столкнетесь, начиная работу над новой архитектурой данных. Архитекторы и инженеры любого профиля найдут здесь ответы на свои частые вопросы, а также юзкейсы реальных компаний с примерами того, что сработало, а что нет и почему.Вы получаете не очередную «теорию уровней», а полное практическое руководство, позволяющее разобраться, как правильно проектировать и реализовывать каждый уровень на Microsoft Fabric и Azure Databricks (с готовыми примерами кода и GitHub-репозиторием); реальные кейсы внедрения в AP Pension, Amadeus и ZEISS; рекомендации о том, как вписать медальон в data mesh; разбор таких вопросов, как контракты данных, безопасность и генеративный ИИ (включая RAG и работу с неструктурированными данными).Для дата-инженеров, архитекторов данных, глав дата-офисов и всех, кто устал от «еще одного озера, которое никто не может использовать».
Научный редактор книги — Евгений Войнов — тимлид Java-разработчиков в Яндекс Маркете. Ранее работал в компании КРОК: 6 лет руководил группой Java-разработчиков, 3 года работал техническим менеджером. Был ментором разработчиков и будущих руководителей, преподавал в учебных программах для студентов и школьников. Более 15 лет опыта разработки систем для государственного и коммерческого сектора.
- Доступное изложение сложных тем: книга объясняет проектирование баз данных с помощью забавных аналогий и визуалов, делая обучение легким и интересным даже для новичков.
- Практический подход: множество примеров кода на SQL, упражнений и советов по реализации, которые помогут сразу применить знания в реальных проектах.
- Полный охват от основ до продвинутого: от введения в SQL и связанные таблицы до нормализации, оптимизации и интеграции ИИ — все этапы дизайна БД в одной книге.
- Фокус на безопасности и эффективности: узнайте, как защитить данные, оптимизировать хранение и индексацию, чтобы ваши базы работали быстро и надежно.
- Актуальность для современной разработки: раздел о генеративном ИИ показывает, как использовать AI для анализа требований, создания сущностей и реализации БД, что особенно полезно в эпоху машинного обучения.