LLM-ядро для метчинга резюме и вакансий. Кейс Talentway.

Стартап Talentway - яркий пример сервиса, использующего ИИ-технологии как основное конкурентное преимущество. Суть сервиса такая: есть база вакансий (источники вакансий: LinkedIn, Indeed и тд) и есть база резюме. Нужно к данной вакансии подобрать наиболее подходящие к ней резюме. Суть методики довольно проста: давайте опишем основные параметры, описывающие и вакансию и резюме в некотором структурированном виде, а затем сделаем скоринг по этим параметрам.

Проблема в том, что многие важные параметры, которые нужно учесть, описаны в текстах в очень произвольном виде, иногда даже в завуалированном. Например, нужно по тексту вакансии ответить на вопросы:

Сколько лет менеджерского опыта требуется на данную позицию.
Опыт работы в каких индустриях предпочтителен для данной позиции.
В каких локациях компания предлагает работу при гибридном формате трудоустройства.
Какие виды бонусов предполагаются для данной вакансии и тд.

В до LLM-ную эпоху решение задачи извлечения структурированных данных (или IE - Information Extraction) было бы достаточно трудозатратным: потребовались бы обьемные размеченные людьми датасеты.
У нас же базовый прототип с приемлемым уровнем точности на базе API OpenAI и structured output занял пару месяцев.

Как решали задачу

К счастью, задача Infromation Extraction достаточно популярна, соответственно на момент старта проекта существало некотрое количество академических работ на эту тему. Так что первым делом мы изучили последние работы из вот этого замечательно репозитория.

Далее, для каждого извлекаемого параметра были разработаны промпты с наборами few-shot примеров (иногда использовались цепочки рассуждений - CoT для демонстрации, почему результат должен быть именно такой), для особо сложных случаев использовался каскад нескольких промптов, когда результат работы одного промпта затем подавался в контекст второго и т.д. В качестве основной модели использовался GPT-4o-mini со structured output (гарантированным выводом результата в json формате).

Отдельным пунктом стояла задача представления результата в виде, пригодном для оценки результатов промптов живыми людьми, так как сравнивать два json (эталонный пример и тот, что выдала LLM) достаточно проблематично. Эту задачу мы решили набором скриптов, перегоняющих json в раскрашенные excel таблички, которые было удобно просматривать глазами, а также наборами промптов для сравнения результатов (наивная реализация LLM-as-a-judge).

На последнем этапе все раработанные скрипты были завернуты в микросервисы, которые взаимодействовали с остальными сервисами платформы через REST API или через сообщения Kafka.

Результаты:

Наше LLM-ядро показало уровень точности выше 85% на выборке из нескольких тысяч неструктурированных документов, что позволило вывести решение в полноценный продакшн. Благодаря внедрению LLM-ядра, Talentway получил мощный инструмент для автоматизированного и высокоточного метчинга резюме и вакансий.
Это позволило:

Значительно улучшить качество подбора кандидатов

Сократить время на поиск подходящих специалистов

Повысить общую эффективность рекрутингового процесса как для компаний, так и для соискателей

На данный момент проект получил первых платящих пользователей и активно развивается.

Этот кейс стал важным шагом в нашем пути к созданию универсального LLM-ядра, способного эффективно обрабатывать неструктурированные текстовые данные в различных доменах — от рекрутинга до e-commerce и EdTech.

Хотите узнать, как виртуальные ИИ-ассистенты и машинное обучение могут преобразить ваш бизнес?

Свяжитесь с нами, и мы предложим индивидуальные решения для ваших задач!

Оставить заявку

Статьи и кейсы

CDP

В чем разница между Яндекс.Метрикой и CDP?

Разбираемся, какие задачи решают системы веб-аналитики, а какие задачи решают платформы пользовательских данных (CDP - customer data platform), в чем их сходство, а в чем - принципиальное различие.

⟶

Кейс

LLM-ядро для метчинга резюме и вакансий. Кейс Talentway.

Как мы решали задачу извлечения структурированной информации с помощью LLM для сервиса метчинга резюме и вакансий.

⟶

Голосовые боты

Снижаем расходы курьерской службы с помощью голосовых чат-ботов. Кейс ASH

Кейс с простой автоматизацией на базе SaluteSpeech для сокращения расходов на логистику

⟶