Timescale улучшает PostgreSQL для ИИ с новыми расширениями pgvectorscale и pgai

Приложения и игры / Desktop / Timescale улучшает PostgreSQL для ИИ с новыми расширениями pgvectorscale и pgai
06.07.2024

Инновации, улучшающие производительность AI-приложений и продуктивность разработчиков

pgvectorscale позволяет разработчикам создавать более масштабируемые AI-приложения с более высокой производительностью поиска по встраиваниям и экономичным хранением данных. pgvectorscale дополняет pgvector — популярное open-source расширение для векторных данных в PostgreSQL — и вводит две ключевые инновации: индекс StreamingDiskANN (адаптированный из исследований Microsoft) и Статистическую Бинарную Квантизацию (разработанную исследователями Timescale и улучшающую стандартные техники бинарной квантизации). Согласно бенчмаркам Timescale, с pgvectorscale PostgreSQL достигает 28-кратного снижения p95 задержки и 16-кратного увеличения пропускной способности запросов по сравнению с Pinecone для приблизительных запросов ближайших соседей при 99% точности. В отличие от pgvector, написанного на C, pgvectorscale разработан на языке программирования Rust, предлагая сообществу PostgreSQL новый путь для вклада в поддержку векторов.

pgai приносит больше AI-рабочих процессов в PostgreSQL, упрощая разработчикам создание приложений для поиска и дополненной генерации (RAG). Первоначальный выпуск поддерживает создание встраиваний OpenAI и получение завершений чатов OpenAI из моделей, таких как GPT4o, непосредственно в PostgreSQL. Эта интеграция позволяет выполнять задачи классификации, суммаризации и обогащения данных на существующих реляционных данных, упрощая процесс разработки от концепции до производства.

«Pgvectorscale и pgai невероятно захватывающие для создания AI-приложений с PostgreSQL. Наличие функций встраивания прямо в базе данных — это огромный бонус», — говорит Веб Бегол, CTO Market Reader, компании, использующей облачное предложение PostgreSQL от Timescale для создания платформы финансовой информации с поддержкой AI. «Ранее обновление наших сохраненных встраиваний было утомительной задачей, но теперь, с интеграцией всего этого, это обещает быть гораздо проще и эффективнее. Это сэкономит нам значительное количество времени и усилий.»

«Pgvectorscale и pgai — отличные дополнения к экосистеме AI PostgreSQL. Введение Статистической Бинарной Квантизации обещает молниеносную производительность для поиска по векторам и будет ценным при масштабировании нашей векторной нагрузки», — сказал Джон МакБрайд, глава инфраструктуры OpenSauced, компании, создающей платформу аналитики с поддержкой AI для open-source проектов с использованием облачного предложения PostgreSQL от Timescale. «Pgai устраняет необходимость для разработчиков повторно реализовывать общую функциональность самостоятельно, и я взволнован возможностями, которые она открывает.»

Вызов необходимости специализированных векторных баз данных

Основное преимущество специализированных векторных баз данных, таких как Pinecone и многие другие, заключалось в их производительности, обусловленной архитектурами и алгоритмами, специально разработанными для хранения и поиска больших объемов векторных данных. Однако pgvectorscale от Timescale бросает вызов этому представлению, привнося такие специализированные архитектуры и алгоритмы в PostgreSQL в виде расширения, помогая популярной универсальной базе данных обеспечивать сопоставимую и часто превосходящую производительность по сравнению со специализированными векторными базами данных. Согласно бенчмаркам Timescale, которые включали запросы к набору данных из 50 миллионов встраиваний Cohere (768 измерений), PostgreSQL превосходит оптимизированный для хранения индекс Pinecone (s1) с 28-кратным снижением p95 задержки и 16-кратным увеличением пропускной способности запросов для приблизительных запросов ближайших соседей при 99% точности. Более того, PostgreSQL с pgvectorscale достигает 1.4-кратного снижения p95 задержки и 1.5-кратного увеличения пропускной способности запросов по сравнению с оптимизированным для производительности индексом Pinecone (p2) при 90% точности на том же наборе данных.

Экономические преимущества также весьма убедительны.

Обновлено: 06.07.2024