СВОБОДНЫЕ ВЕКТОРА

24 января 2024

Один из методов использования языковых моделей – умный поиск. Нейросети умеют превращать куски документов в длинный набор чисел (“вектор”),в котором зашит смысл изначального сообщения. Одинаковые тексты дадут одинаковые вектора, одна и та же мысль изложенная совершенно разными словами – похожие.

Знания нашего бизнеса – описания товаров или отзывы клиентов – можно преобразовать в вектора и положить в специальную векторную базу данных. Потом в вектор мы превращаем, например, запрос пользователя при поиске и база данных возвращает нам похожие объекты из коллекции. Человек спросил “как сделать тихо”, а мы ему вернули кусочек текста про шумоизоляцию – ни одного совпадающего слова, но идеальное совпадение смысла.

Или такой поиск промежуточным этапом обработки был. Десять самых подходящих кусочков вместе с изначальным запросом можно в условный ChatGPT отправить, чтобы он что-то интеллектуальное с ними сделал.

Одна из популярных реализаций векторных баз данных – стартап с российскими корнями Qdrant. Кроме приятного нам происхождения основателей его отличие от конкурентов – открытый исходный код продукта. В недавнем раунде Qdrant привлек 28 миллионов долларов инвестиций.

https://qdrant.tech/

Пишу каждый день.

Подписаться в Telegram Подписаться по почте