13 сентября 16:06
«Платформа ОФД» представила технологию потоковой обработки коротких текстов
Поделиться
twtg

IT-компания «Платформа ОФД» представила ноу-хау – технологию обработки коротких текстов с опечатками, ошибками и сокращениями, которые встречаются в кассовых чеках. Разработка крупнейшего оператора фискальных данных, входящего в экосистему Сбера, уже внедрена в работу и ежедневно распознает информацию из 48 млн кассовых чеков. Решение разработано на базе анализа более 55 миллиардов фискальных документов, которые накоплены за 5 лет работы компании с агрегированными обезличенными данными. Потоковая обработка коротких текстов позволяет точно определять и идентифицировать товары и категории, указанные в чеках с кассовых устройств. Процесс распознавания происходит в режиме реального времени, позволяя в «потоке» документов скоростью более 1 000 транзакций в секунду - классифицировать, сравнивать и верифицировать товарные записи, в том числе содержащие различные ошибки и неполные данные.

Часто в чеках встречается короткое наименование товара и его характеристик, либо в названии допущены ошибки или опечатки. Это связано с ограничениями по объему символов в строках фискальных документах, которые выдаются покупателю. Другая причина – пресловутый человеческий фактор. Благодаря технологиям Machine Learning и накопленной за несколько лет экспертизе в данных, мы научили нейросети нашей системы четко, оперативно, с минимум погрешностей – распознавать и анализировать поступающую информацию.Сегодня такая потоковая обработка охватывает до 21 миллиона товаров (SKU) из 3,5 тыс. категорий, с 6 уровнями вложенности

База для работы с короткими текстами «Платформы ОФД» сейчас включает 5 млрд уникальных записей товаров, 150 млн написаний товаров в день. На потоке определяется более 3 млн брендов. При этом данные для классификации агрегируются как из чеков, так и из свободного доступа (отраслевые классификаторы/ каталоги с сайтов ретейлеров/ данные маркировки). Ноу-хау помогло выявить, какова доля чеков с сокращениями и ошибками. По оценкам «Платформы ОФД», грамматические ошибки, опечатки и сокращения ежедневно допускаются в 60-65% всех чеков из продуктовой розничной торговли. При этом еще два года назад этот показатель был на уровне 80-85%.

IT-компания «Платформа ОФД» - оператор фискальных данных (ОФД), электронного документооборота (ЭДО) и электронной отчетности. Компания ежедневно обрабатывает и передает в ФНС и оператору системы маркировки товаров ЦРПТ свыше 48 млн кассовых чеков. Развивает сервисы для предпринимателей, бухгалтерии, менеджеров.
№1 в рейтинге российских ОФД по версии CNews Analytics. Входит в экосистему Сбера. Официальный сайт — platformaofd.ru

Поделиться
twtg
Ещё по теме Технологии
  • Сбер и Сколтех создают экосистему искусственного интеллекта для нужд медицины

    Группа компаний Сбер и Сколковский институт науки и технологий объявили о подписании сделки по созданию экосистемы для развития искусственного интеллекта в здравоохранении России. Оператором выступит созданная летом 2020 года компания СберМедИИ. Экосистема объединяет разработки научных команд Сколтеха с «облачной» инженерной инфраструктурой Сбера и станет технологическим фундаментом для создания сервисов в здравоохранении.
    28 декабря 15:12
  • ФЛИП: полностью автономный транспорт от SberAutoTech

    Компания экосистемы Сбера — SberAutoTech — представила прототип полностью автономного электрического транспорта собственной разработки. Новинка получила название ФЛИП и реализует концепцию новой мобильности: полностью беспилотное транспортное средство (максимальный, пятый уровень автономности по международной классификации) обеспечивает быстрое, безопасное и комфортное перемещение пассажиров с использованием новейших технологий из мира IT и автомотив.
    27 мая 9:57

Мы используем файлы cookie

ПАО Сбербанк использует cookie (файлы с данными о прошлых посещениях сайта) для персонализации сервисов и удобства пользователей. Сбербанк серьезно относится к защите персональных данных — ознакомьтесь с условиями и принципами их обработки. Вы можете запретить сохранение cookie в настройках своего браузера.