Автоклассификатор и NLP платформа

Заказчик:
ПАО ВТБ
Руководитель проекта со стороны заказчика
Год завершения проекта
2024
Сроки выполнения проекта
ноябрь, 2023 — сентябрь, 2024
Масштаб проекта
2700 автоматизированных рабочих мест
Цели

1.     Снижаем расходы банка на ФОТ КЦ.

2.     Формируем систему онлайн-мониторинга для мгновенного выявления отклонений и работы с ними. Например, всплески клиентской активности по определенным тематикам в связи геополитическими или иными событиями, или снижение активности по причине технических сбоев.

3.     Повышаем точность оффлайн аналитики клиентских обращений. Выявляем продукты и сервисы, которые вызывают сложности у клиентов и требуют доработок. Инициируем доработки на стороне продуктовых направлений.

4.     Сокращаем время обслуживания клиентов в каналах КЦ. Повышаем доступность операторов на линии.  

5.     Повышаем удовлетворенность операторов, автоматизируя рутинные операции.

6.     Повышаем точность маршрутизации клиентов на нужную группу операторов.

Результаты

1.     Точность классификации > 95%. Полное исключение ручного труда операторов.

2.     Автоклассификация 70 млн. обращений в год (~ 200 000 в день) в голосовых и текстовых каналах КЦ.

3.     Экономия на ФОТ операторов ~ 50 млн.рублей в год.

4.     Онлайн реакция на любые отклонения клиентской активности по тематикам

5.     Инициировано >300 продуктовых доработок для клиентов на основании оффлайн аналитики

6.     90% клиентских сценариев у операторов запускаются автоматически, на основе определения тематики из первой фразы или сообщения клиента.

7.     Механизм используется в том числе для маршрутизации клиента на нужную группу операторов при переходе из автоматизированных каналов.

Уникальность проекта

1. Автоклассификация 100% клиентских обращений в голосовых и текстовых каналах КЦ (> 70 млн обращений в год (200 тыс. в день!)). Полностью исключена ручная работа операторов.

Более 1000 тематик голоса и более 700 тематик чата автоматически раскладываются по 4х уровневому классификатору.

2. Использование нейронных сетей и мультилейбл-алгоритма.

Определяем и фиксируем все тематики в звонке. Если клиент задал в одном звонке 3-5 вопросов – система классифицирует и зафиксирует каждый вопрос!

3. Алгоритм кластеризации неклассифицированного остатка (DBSCAN), для быстрой поддержки изменений

Группировка звонков, не попавших в тематики, на основе семантической близости.  Позволяет быстро анализировать большие объемы данных, видеть тренды и закономерности, удалять устаревшие тематики и создавать новые. 

Использованное ПО

- Собственная разработка (90%)

- Kafka

- PostgreSQL

- Python

- Pytorch

Сложность реализации

1.     Развитие и поддержка решения в период импортозамещения ядра телефонии и других ключевых компонент. Необходимость поддерживать взаимодействие с 2мя телефониями одновременно без потери качества и скорости классификации.

2.     Регулярная подстройка решения под новые продукты и сервисы ВТБ а так же продукты и сервисы интегрируемых банков.

3.     Классификация каждой тематики в рамках одного обращения (от 1 до 5)

4.     Ежегодная встройка новых технологий и AI инструментов, доработки под новые каналы.

5.     Формирование единого классификатора для всех продуктов, сервисов и каналов банка.

Описание проекта

Система автоклассификации клиентских обращений – это автоматическая система определения и фиксации  вопросов и тематик  с которыми клиенты обращаются в банк.

На данный момент система полностью тиражирована на контактный центр банка, включая голосовые и текстовые каналы. И продолжает свое развитие в части использования новых технологий и новых каналов применения.

С технической точки зрения это сложная многокомпонентная сборка:

1.     При обращении клиента голосовой запрос переводится в текст с помощью ASR модуля (текстовые запросы используются в чистом виде). 

2.     далее NLU компонент извлекает значимый  контекст из реплики диалога и передает данные в NLP платформу.

3.     NLP платформа с помощью нейронной сети на основе фреймворка PyTorch с использованием RuBERT векторизирует текст и ищет максимально похожую классификацию из справочников.

4.     Благодаря технологии мультилейбл-классификации удается определить каждый запрос в рамках звонка, даже если клиент задает 3-5 и более вопросов.

5.     Неклассифицируемый остаток (не более 5%) автоматически направляется в модуль кластеризации, для группировки звонков на основе семантической близости.  Это позволяет быстро анализировать большие объемы данных, видеть тренды и закономерности, удалять устаревшие тематики и создавать новые.

6.     Данные в онлайн режиме передаются в хранилище данных, и поступают в системы мониторинга и отчетности для анализа отклонений. Анализ в онлайн режиме позволяет максимально быстро реагировать на поломки, инциденты и всплески клиентской активности, связанные с экономическим и политическим ландшафтом. Анализ в оффлайн режиме регулярно поставляет обратную связь бэк-подразделениям для улучшения продуктов и сервисов банка.

7.     Так же система содержит инструменты отбора данных для разметки и инфраструктуру для дообучения моделей.

С точки зрения бизнеса и оператора – это бэк-сервис, который самостоятельно фиксирует все обращения клиента, освобождает оператора от рутины, существенно повышает точность классификации  и выявляет любые отклонения и тренды.

География проекта

РФ. Все подразделения контактного центра Банка (8 регионов)

Дополнительные презентации:
ВТБ_Global CIO_2024_Автоклассификатор и NLP платформа.pdf
image.png
image.png
image.png
image.png
image.png
image.png
image.png

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

Год
Предметная область
Отрасль
Управление
Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.