Компания начнет продавать систему «Шерлок», которая распознает удостоверения личности на урду и персидском языках. Для этого разработчики собрали уникальный датасет из 9 тысяч изображений документов.
Российский разработчик Smart Engines расширяет географию и выходит на рынки Ирана и Пакистана. Об этом CNews сообщил гендиректор компании Владимир Арлазаров.
На новых рынках компания предложит свою систему «Шерлок» — решение для распознавания и проверки документов. Оно поддерживает удостоверения личности на урду и персидском языках. По словам Арлазарова, это стало возможно благодаря созданию специализированного датасета MIDV-UP. В нем собрано более 9 тысяч изображений документов Пакистана и Ирана.
Датасет включает тысячу уникальных образцов — ID-карты, водительские права и свидетельства о рождении из Ирана, а также ID-карты Пакистана. Все данные синтезированы искусственно, без использования документов реальных людей.
В Smart Engines отмечают, что до этого времени системы ИИ почти не работали с урду и персидским языком. Эти языки используют модифицированный арабский алфавит и отличаются сложными лигатурами, что затрудняло обучение.
Новый датасет охватывает разные сценарии предъявления документов — от сканов до фото и видео с бликами, тенями и искаженной перспективой. Разработчики считают, что это даст более надежную защиту от подделок и дипфейков.
Читать далее:
Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу
Испытания ракеты Starship Илона Маска вновь закончились взрывом в небе
Сразу четыре похожих на Землю планеты нашли у ближайшей одиночной звезды
Обложка: freepik