Технологии ABBYY в корпоративной среде

 

Идея пообщаться с одним из ключевых топ-менеджеров ABBYY у нас возникла после подведения компанией итогов работы на отечественном рынке потокового ввода документов и данных в 2012 году, ставшем для разработчика невероятно успешным, о чем свидетельствуют выросшие на 93% продажи корпоративных решений (для сравнения: годом ранее данный показатель составил внушительные 65%). Компания реализовала более 30 крупных проектов на базе линеек продуктов ABBYY FlexiCapture и ABBYY Recognition Server, при этом средний размер сделки увеличился более чем в два раза по сравнению с 2011 годом. Были реализованы значимые проекты в банках, страховых компаниях, нефтегазовой отрасли и государственном секторе. В списке ключевых заказчиков ABBYY отметились Сбербанк, ВТБ, «Пробизнесбанк», Альфа-Банк, «НОМОС-БАНК», «Тойота Банк», «Югория», «Росгосстрах», «Ингосстрах», «СИБУР-ЦОБ», КЭС-Холдинг, Федеральная налоговая служба, Министерство образования РФ и прочие крупные организации.

Генеральный директор «ABBYY Россия» Григорий Липич

ServerNews: Григорий, чем, на ваш взгляд, обусловлена столь впечатляющая динамика роста систем массового ввода и обработки документов компании?

Григорий Липич: Существенное увеличение темпов роста бизнеса в корпоративном сегменте связано как с тенденциями рынка потокового ввода документов, так и с завершением крупных сделок, работа над которыми велась в течение нескольких лет. Также немалую роль в развитии бизнеса ABBYY сыграло развитие партнерской сети, которая в настоящий момент насчитывает более 40 компаний.

В послекризисный период все больше организаций в России стали уделять внимание вопросам оптимизации бизнес-процессов, автоматизации ввода данных в информационные системы и снижения затрат на обработку документов. По данным исследования «Российский рынок ECM 2011/2012 гг.», проведенного проектом DOCFLOW, 93% компаний планируют расходы в области ECM. Из них 89% собираются переводить документы в электронный вид и 78% — внедрять решения для ввода информации на базе технологий распознавания текста. В этом плане рост нашей компании полностью отвечает тенденциям рынка потокового ввода документов и данных.

ServerNews: Прослеживается ли разница между российским и зарубежным корпоративными рынками OCR-решений?

Григорий Липич: Некоторые различия имеют место, и основная причина этого — низкий уровень проникновения решений в области потокового ввода документов и данных в отечественных компаниях. Кроме того, российский рынок сильно зависим от инвестиционного климата и экономической ситуации в стране: при благоприятных условиях он развивается очень динамично и так же быстро останавливается в случае возникновения тех или иных кризисных явлений. Ярким примером тому является прошедший 2012 год, в котором было завершено множество ранее отложенных проектов, спешно приостановленных заказчиками из-за кризиса в 2009–2010 гг.

Также у российских и зарубежных заказчиков разнится вектор приложения сил к конкретным бизнес-процессам. Если в нашей стране интерес к решениям потокового ввода документов и данных проявляют в основном финансовые организации и страховые компании, то в странах Западной Европы и США такие проекты находят широкое применение и во многих других отраслях. В качестве примера можно привести сектор здравоохранения, отличающийся у нас не только уровнем инвестиций, но и документальной базой. В тех же США многие медицинские документы четко формализованы и структурированы. У нас же пока чаще используются рукописные документы, которые и обычный человек с трудом может прочесть из-за оставляющего желать лучшего почерка доктора. Это совершенно неструктурированные данные, которые в лучшем случае можно оцифровать и хранить в виде изображений для того, чтобы иметь к ним более быстрый доступ. В будущем, когда эти документы перейдут в более формализованный и структурированный вид, мы сможем оптимизировать их обработку.

С другой стороны, есть и положительные моменты, связанные с ростом популярности в России средств автоматизации ввода документов и данных. В отечественных компаниях практически отсутствуют старые внедренные системы, поэтому они менее инертны и сразу инвестируют в последние технологические достижения, оптимизируя свои процессы за счет развертывания современных решений. За рубежом же, в силу более раннего развития рынка, ситуация иная: если у клиентов в Соединенных Штатах или Западной Европе уже есть какое-то работающее решение, то для того, чтобы его обновить, им требуется провести дополнительные работы, связанные с исследованием текущих предложений на рынке, построить план нового внедрения и выполнить прочие задачи по переходу на более современные технологии.

ServerNews: Около 30% реализованных в 2012 году проектов ABBYY были связаны с автоматизацией процессов ввода документов в Общих центрах обслуживания (ОЦО). Можете рассказать об этом направлении бизнеса?

Григорий Липич: Как я уже говорил, все больше компаний стали уделять внимание эффективности бизнес-процессов и сокращению затрат. При этом укрупнение бизнеса, которое особенно заметно в банковской отрасли и страховом сегменте, приводит к необходимости унифицировать бизнес-процессы и объединять информационные системы. Один из способов существенного сокращения операционных издержек и оптимизации бизнеса — вынос непрофильных процессов в Общий центр обслуживания (ОЦО) и внедрение системы потокового ввода документов. Поскольку треть реализованных в 2012 году проектов была связана с ОЦО, мы решили выделить это направление как тренд.

Если же говорить о конкретных документах, из которых извлекают данные, то в тех же банках это заполненные анкеты, паспорта или скан-копии и, например, справка формы 2-НДФЛ, которые нужны при оформлении автокредитов, пластиковых карт (зарплатных и кредитных), потребительских кредитов или кредитов для юридических лиц. В страховых компаниях — это примерно тот же набор документов, но уже необходимых для оформления разных видов страховки (прежде всего, КАСКО, ОСАГО). Данный набор документов и сценарий извлечения данных потребителей характерен для компаний, работающих с большим количеством клиентов. Также потоковый ввод данных применяется для извлечения данных из счетов, счетов-фактур и накладных. Этот сценарий характерен для ретейлеров, ресторанов и других компаний, работающих с множеством поставщиков, с которыми приходится вести постоянный обмен бумажными документами.

Общий центр обслуживания позволяет компаниям консолидировать однотипные функции в рамках одного подразделения, которое может быть расположено в другом регионе, с более низким уровнем стоимости рабочей силы. Также ОЦО позволяет использовать веб-станции сканирования, например в тех случаях, когда у компании нет возможности установить на компьютер сотрудника полноценный клиент (из-за ограничений по безопасности, удаленности места или другим причинам). Тогда, например, агент страховой компании или банка может работать на удаленном объекте, но при этом никакие пользовательские данные на его компьютере храниться не будут: все они будут обрабатываться удаленно и сразу же вноситься в информационную систему компании. Естественно, такая схема работает только для тех организаций, в которых потоки документов значительны — тысячи, десятки тысяч документов за отчетный период вроде месяца. Если поток документов небольшой, то внедрение ОЦО вряд ли будет экономически оправданным.

ServerNews: 2012-й стал годом повышенного интереса ряда заказчиков к внедрению в свои бизнес-процессы мобильных технологий обработки документов. Что может предложить ABBYY своим клиентам в этой сфере?

Григорий Липич: И в России, и в мире мы видим, что первопроходцами в области мобильного ввода являются финансовые институты, банки и страховые компании. Во-первых, они работают на высококонкурентном рынке и активно ищут новые способы привлечения клиентов, а во-вторых, думают о том, как сократить издержки. Что важно, выиграют от применения таких технологий и поставщики финансовых услуг, и их потребители. Клиентам больше не придется приходить в офис страховой компании или банка, чтобы получить расчет размера страховки или предварительное одобрение по кредиту, оплатить квитанции на квартплату и другие похожие услуги. Ведь можно просто сделать фотографию нужного документа камерой смартфона или планшета, затем наши технологии извлекут из этого снимка необходимые данные, а после специальное приложение отправит соответствующий запрос, который вернется к вам уже в обработанном виде. В результате компания повысит лояльность своих клиентов за счет экономии их времени и усилий и одновременно сократит свои издержки, освободив персонал в офисе для более продуктивных задач, чем простой прием платежей.

Процесс ввода данных с помощью мобильного устройства можно разделить на несколько этапов. Первый — получение изображения достаточного качества для последующего извлечения из него данных. На этом этапе работает наша технология ABBYY Mobile Imaging SDK, которая позволяет произвести предобработку изображения, в том числе автоматическую (сжатие, урезка, выравнивание изображения и освещенности снимка), и включает ряд интересных возможностей, например автоспуск — функцию, позволяющую дождаться момента, когда рука не трясется, чтобы снимок получился четким и годным для распознавания. Второй этап — распознавание. Простые документы с небольшим объемом информации можно распознать непосредственно на смартфоне. Для этого есть средство разработки ABBYY Mobile OCR SDK. Более сложные документы обычно распознаются уже где-то в облаке. Для этой части процесса может применяться либо ABBYY Cloud OCR SDK, либо приложение для потоковой обработки документов ABBYY FlexiCapture. После распознавания извлеченные данные передаются в информационную систему, а пользователь на своем устройстве получает отчет о результатах обработки отправленных им документов.

Даже если из документов не нужно ничего распознавать, то сценарий мобильного сканирования (первый этап из описанных выше) будет полезен компаниям, сотрудники которых работают вне офиса, например как в банках и страховых компаниях, и принимают документы с данными у клиентов, возможно, выезжая к ним. В этом случае мобильное устройство заменяет комплект из МФУ и компьютера и выступает точкой ввода данных (из тех же анкет, справок, счетов-фактур, платежных поручений и т.д.), которые агент сможет сразу же отправить для обработки в компанию. Таким образом, сотрудники этих компаний экономят время, становятся мобильнее и могут обработать больше запросов клиентов за ограниченный промежуток времени.

ServerNews: Интерес к мобильным сценариям ввода документов в информационные системы огромный, и наверняка у вас уже сформированы какие-то наиболее приоритетные направления в данной сфере?

Григорий Липич: Мы намерены работать дальше и улучшать технологии обработки, чтобы, например, такие вещи, как дрожание руки снимающего, меньше влияли на качество получаемой в результате картинки. С развитием технологий качество съемки и статических фото и видео будет увеличиваться, в этом смысле может быть интересным анализировать не только одно изображение, а набор из нескольких снимков, сделанных последовательно, или небольшой видеоряд, избежать таких вещей, как размытое изображение, избежать повторной съемки документов и сделать интерфейс взаимодействия более простым. Также мы будем улучшать механизмы предобработки изображений непосредственно на мобильном устройстве и совершенствовать интерфейсы взаимодействия с пользователем.

По данным исследования Harvey Spencer Associates, на мировом рынке существует устойчивый спрос на ввод данных при помощи мобильных устройств. К 2018 году ожидается экспоненциальный рост данного направления до $3,2 млрд. Также ожидается, что к 2016 году в 65% случаев для ввода документов в информационную систему будет использоваться камера смартфона или планшетного компьютера. Это интересные прогнозы, посмотрим, оправдаются ли они со временем.

ServerNews: Помимо мобильности еще одним трендом в корпоративной среде являются облачные технологии. Насколько нам известно, ABBYY ведет разработки cloud-решений...

Григорий Липич: Да, у нашей компании есть облачный сервис ABBYY Cloud OCR SDK, о котором я упоминал ранее. Он предоставляет доступ к нашим технологиям оптического распознавания текста, меток и штрихкодов посредством Web API. Этот сервис будет полезен, когда разработчик желает встроить наш движок распознавания в свой продукт, но при этом покупка традиционного SDK является нецелесообразной с точки зрения решаемых задач или экономически неоправданной. Облачный сервис решает этот вопрос, потому что любой разработчик может начать пользоваться OCR-технологиями для распознавания и встроить их в своё приложение без преодоления высокого входного ценового барьера, который есть в случае приобретения и лицензирования традиционного OCR SDK. Ценовая политика сервиса достаточно демократичная, существуют различные варианты пакетов страниц для распознавания: от бесплатного ознакомительного, включающего возможность распознать 50 страниц, до пакета стоимостью около 200 долларов США за 5000 страниц, а также есть варианты с договорной ценой, когда объёмы распознавания превышают 5000 страниц. С увеличением объёма цена за обрабатываемую страницу падает.

С другой стороны, само по себе распознавание, необходимое для извлечения данных, — очень ресурсоемкий процесс, который требует значительных вычислительных мощностей на стороне предприятия, использующего OCR. И существуют сценарии, когда компаниям невыгодно устанавливать эти мощности у себя, например, когда в ее работе велика роль сезонного фактора, либо при возникновении краткосрочной задачи, например для оцифровки за короткий срок огромного бумажного архива. В этом случае компании также могут использовать наш сервис ABBYY Cloud OCR SDK.

ServerNews: Всё возрастающие объемы неструктурированной информации, получившие в профессиональной IT-среде название «большие данные» (Big Data), требуют инновационных подходов к обработке и аналитике данных. Не станет ли разрабатываемая вами технология ABBYY Compreno в перспективе одним из возможных инструментов для работы с Big Data?

Григорий Липич: Разные специалисты вкладывают в термин Big Data разное смысловое наполнение, но, тем не менее, сходятся во мнении, что существующих средств поиска и индексации информации для работы с большими массивами данных недостаточно. Многие отмечают, что необходимо отходить от базовых методов работы с информацией вроде поиска по ключевым словам или поиска по маске и переходить к более интеллектуальным поисковым алгоритмам и механизмам классификации. Именно такие подходы, базирующиеся на смысловом анализе текста и обработке естественного языка, и реализованы в системе ABBYY Compreno.

Поэтому, безусловно, мы связываем большие надежды с тем, что технология ABBYY Compreno и построенные на ее базе продукты будут изменять ландшафт работы с тем, что называется «большие данные», или Big Data. Однако это не означает, что мы строим планы по самостоятельной разработке всех возможных конечных продуктов в этой области. В данном случае мы нацелены на построение технологической платформы, на основе которой можно будет создавать различные решения. Конечно, какие-то решения мы выпустим сами, но мы открыты для сотрудничества и будем лицензировать эту технологию и другим разработчикам, точно так же как лицензируем технологии распознавания текстов. За последнее десятилетие мы активно инвестировали и продолжаем инвестировать в разработку технологии ABBYY Compreno, которая позволит строить разные решения, связанные с использованием смысловой информации при классификации документов, поиске и анализе информации. Даже в тех продуктах, которые у нас есть сейчас, данная технология может быть востребованной. Мы видим это по отзывам потенциальных и существующих потребителей технологии, с которыми ведем ряд пилотных проектов. С некоторыми партнерами из формата пилотов уже переходим к промышленным внедрениям Compreno.

ServerNews: Каковы, на ваш взгляд, прогнозы развития мирового и российского рынка потокового ввода документов и данных?

Григорий Липич: Я думаю, что в России и СНГ это будут как минимум двузначные показатели роста не ниже 30%, а если не будет никаких неприятных сюрпризов в экономике, то ближе к 50%. По крайней мере то, что мы видим сейчас в нашей воронке продаж, позволяет говорить о двузначных цифрах роста. Если рассматривать мировой рынок, то он характеризуется более спокойными показателями роста и, по оценкам Harvey Spencer Associates, будет расти до 10% в год. При этом чуть бОльшая динамика роста будет наблюдаться на развивающихся рынках вроде Бразилии и Китая, которые инвестируют в системы массового ввода и обработки документов примерно на том же уровне, что и Россия. Конца эры бумажных носителей информации пока не предвидится, поэтому интерес к решениям в области потокового ввода документов и данных будет только расти.

К тому же очевидной тенденцией становится ввод данных при помощи мобильных устройств, как я уже говорил, он является одним из ключевых драйверов рынка. На примере существующих и потенциальных клиентов компании ABBYY мы видим, что интерес к мобильным сценариям ввода документов в информационные системы в прошедшем 2012 году перешел из разряда теоретического в практический. Мы уже участвуем в пилотных проектах, реализация которых позволит нашим заказчикам как расширить возможности для своих собственных сотрудников, так и предложить новые услуги собственным клиентам.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Постоянный URL: http://servernews.ru/730867
Поделиться:  
Система Orphus