Timescale представила расширения для PostgreSQL, ускоряющие AI задачи

Приложения и игры / Timescale представила расширения для PostgreSQL, ускоряющие AI задачи
06.07.2024

В эпоху стремительного развития технологий, компания Timescale, известная своими облачными базами данных на основе PostgreSQL, представила две революционные open-source расширения: pgvectorscale и pgai. Эти инновации сделали PostgreSQL быстрее Pinecone для AI-нагрузок и на 75% дешевле. Давайте рассмотрим, как работают эти расширения и какие последствия они имеют для разработки AI-приложений.

Введение в pgvectorscale и pgai

Timescale представила расширения pgvectorscale и pgai, стремясь улучшить масштабируемость и удобство использования PostgreSQL для AI-приложений. Эти расширения лицензированы под open-source лицензией PostgreSQL, что позволяет разработчикам создавать приложения для генерации с использованием поиска и AI-агентов с PostgreSQL по значительно меньшей стоимости по сравнению со специализированными векторными базами данных, такими как Pinecone.

Инновации в производительности AI-приложений

pgvectorscale предназначен для помощи разработчикам в создании более масштабируемых AI-приложений с высокой производительностью поиска по векторным представлениям и экономичным хранением данных. Он включает две значительные инновации:

  • StreamingDiskANN индекс: Адаптированный из исследований Microsoft, этот индекс значительно улучшает производительность запросов.
  • Статистическая бинарная квантование: Разработанная исследователями Timescale, эта техника улучшает стандартное бинарное квантование, приводя к значительным приростам производительности.

Согласно бенчмаркам Timescale, с pgvectorscale PostgreSQL достигает 28-кратного снижения p95 задержки и 16-кратного увеличения пропускной способности запросов по сравнению с Pinecone для приблизительных запросов ближайших соседей при 99% точности. В отличие от pgvector, написанного на C, pgvectorscale разработан на Rust, открывая новые возможности для сообщества PostgreSQL в поддержке векторов.

pgai упрощает разработку приложений для поиска и генерации с использованием поиска (RAG). Он позволяет разработчикам создавать OpenAI embeddings и получать OpenAI chat completions непосредственно в PostgreSQL. Эта интеграция облегчает задачи классификации, суммаризации и обогащения данных на существующих реляционных данных, упрощая процесс разработки от концепции до производства.

Реальное влияние и отзывы разработчиков

Веб Бегол, CTO Market Reader, похвалил новые расширения: «Pgvectorscale и pgai невероятно захватывающие для создания AI-приложений с PostgreSQL. Наличие функций embedding непосредственно в базе данных — огромный плюс». Эта интеграция обещает упростить и повысить эффективность обновления сохраненных embeddings, экономя значительное время и усилия.

Джон МакБрайд, глава инфраструктуры OpenSauced, также отметил ценность этих расширений: «Pgvectorscale и pgai — отличные дополнения к экосистеме PostgreSQL AI. Введение статистического бинарного квантования обещает молниеносную производительность для векторного поиска, что будет ценно по мере увеличения нагрузки на векторные данные».

Вызов специализированным векторным базам данных

Основное преимущество специализированных векторных баз данных, таких как Pinecone, заключалось в их производительности благодаря специально разработанным архитектурам для хранения и поиска больших объемов векторных данных. Однако pgvectorscale от Timescale бросает вызов этому мнению, интегрируя специализированные архитектуры и алгоритмы в PostgreSQL. Согласно бенчмаркам Timescale, PostgreSQL с pgvectorscale достигает 1.4-кратного снижения p95 задержки и 1.5-кратного увеличения пропускной способности запросов по сравнению с оптимизированным индексом Pinecone при 90% точности.

Эти нововведения не только делают PostgreSQL более конкурентоспособным решением для AI-нагрузок, но и открывают новые горизонты для разработчиков, стремящихся использовать мощь AI при меньших затратах.

Обновлено: 06.07.2024