Abbyy тест: Тестирование ABBYY FineReader 11 / Хабр
Содержание
Тестирование ABBYY FineReader 11 / Хабр
Недавно вышла 11-я версия известного в России и в мире программного продукта по оптическому распознаванию текста ABBYY FineReader. В этой версии анонсировано множество улучшений, а основной упор делается на увеличение производительности и снижение ошибок. Эти улучшения — в сравнении с 10-й версией. Я же не пользовался этой программой со студенческих лет (с начала 2000-х), и наверняка пропустил версий, эдак, шесть. В те годы интернет и мобильные технологии не были развиты так сильно, а времени было много. Поэтому я был готов брать в библиотеке книгу на час, снимать копии, ехать в один конец города к компьютеру, где есть сканер, затем в другой конец, туда, где есть FineReader, а затем домой, доисправлять ошибки распознавания и форматирования в Word-овских файлах. Сегодня же юзер стал ленивее и требовательнее, поэтому хочу рассмотреть работу с программой в ракурсе современных доступных технологий и острой нехватки времени.
Спасибо dimonline и компании ABBYY за промо-ключ и версию FineReader 11 CE (Corporate Edition), благодаря которым удалось провести несколько тестов.
Тест функциональности
Итак, я взял книгу-путеводитель «Швейцария» и под определенным углом сфотографировал на iPhone несколько разворотов. Один из разворотов:
Итого я снял 14 фотографий, которые достаточно быстро перенес на ноутбук. Конфигурация ноутбука: MacBook Pro 15″ / Core i7 2.66 GHz / RAM 8GB / Mac OS X Lion, а сам FineReader запущен на VMware Fusion / Windows 7 x64 (выделено 2 ядра процессора и 2 GB RAM). Запустил FineReader, выбрал функцию «Файл (изображение) в PDF», выбрал файлы, нажал «Открыть» и перешел в другое окно заниматься своими делами. Примерно через 15 минут характерный звук уведомил об окончании процесса и готовый PDF файл с распознанными страницами предстал пред моим взором. Вот, как выглядит одна из страниц в самом файле:
тем не менее, текст выделяется:
и в блокноте выглядит так:
Далее, я зашел в редактирование изображений и устранил трапециевидное искажение путем указания расположения углов прямоугольной страницы. К сожалению, на моих страницах дополнительно присутствуют сферические искажения. В целом, страница и ее картинки стали выглядеть геометрически правильно, но распознавание текста не изменилось. Тогда я сфотографировал страницу со вспышкой, держа телефон строго вертикально над книгой. В итоге имею такую страницу в PDF:
и выделенный текст неплохо читается в блокноте:
Старинная народная мудрость в действии — лучше качественно снимать, чем потом ретушировать, а точнее — потратить несколько минут на подготовку съемочного места (свет, фон) и оборудования (мегапиксели, фокус), а потом наслаждаться автоматизированным (тут ABBYY постарались) процессом распознавания.
Тест производительности
В домашней библиотеке нашелся 500-страничный мануал по некой компьютерной программе (251-страничный PDF-файл), взятый в просторах интернета. Дабы
не накликать себе гнев богов копирайта соблюсти условия пользования интеллектуальной собственностью скриншоты не вставляю. Страницы сфотографированы с небольшими сферическими искажениями в области переплета. Много картинок и таблиц. Картинки, в основном, — это скриншоты из собственно описанной программы. Результаты теста таковы:
Время открытия файла: 12 минут.
Время распознавания: 26 минут.
Время экспорта в Word: 2 минуты.
Время сохранения проекта: 11 минут.
Из недочетов можно отметить только один — большинство картинок определены как текстовые блоки. Возможно, потому, что на этих картинках скриншоты, включающие в себя строку заголовка и меню программы. Для этого пришлось зайти на каждую страницу с картинкой и поменять тип и границы блоков.
Время корректировки типов блоков: 35 минут.
Выводы
Я решил сделать выводы по каждому из анонсированных улучшений.
Более точное определение типов блоков
Оно, действительно, более точное, но многие картинки определились как текст, хотя имеют прямоугольную форму и множество «не-текста». Возможно, программе требуется дополнительная функциональность в виде настройки чувствительности, некий ползунок со шкалой, на одной стороне шкалы надпись «скорее текст», а на другой — «скорее картинка».
Более стабильная работа с большими (более 100 файлов) пакетами документов
Да, действительно, несмотря на то, что программа выполнялась на виртуальной машине со множеством параллельно запущенных программ, процесс шел стабильно, без сбоев. Для верности распознавание 500-страничного документа было осуществлено 3 раза.
Улучшенное автоматическое и ручное исправление искажений сфотографированных документов
Ручное исправление работает, в то время как автоматических изменений замечено не было. Хотя, текст на искаженной странице распознался корректно. А ведь раньше (лет 10 назад) малейшее искажение неизбежно приводило к ошибкам.
Улучшенная работа с многостраничными документами
Особых проблем в работе с многостраничным документом подмечено не было.
Наличие режимов сохранения в PDF: «Наилучшее качество», «Небольшой размер» и «Сбалансированный режим»
Такие режимы есть, но места на диске и мощности комьютера достаточно для «Наилучшего качества».
Сохранение и конвертирование изображений документов и PDF-файлов в формат ODT (OpenOffice.org Writer), DjVu, ePub, fb2
Вполне полезные и актуальные функции.
Редактор стилей
Эта функция полезна для постобработки. Если цель распознавания — просто читать, а не распечатывать, то пользоваться функцией небязательно.
В окно «Новая задача» вынесены функции, которые бывают нужны чаще всего
Многие программы с древнейших времен имеют такие окна. Я всегда их закрывал и ставил галочку «Больше не выводить это окно». Но в данном случае решил воспользоваться (возможно, сказался переход на Mac и iPhone) и мне понравилось, с тех пор в FineReader пользовался только этим окном. А лазать по меню стало лень.
Заключение
Юзабилити вполне в современном тренде и софтом приятно пользоваться. Определенной категории офисных работников она сильно сэкономит время и нервы. Заявленные улучшения действительно работают. Если бы я снова оказался студентом, то просто фотографировал бы отрывки книг на телефон в библиотеке и распознавал дома (для рефератов и диссертаций). Сейчас же подобная функциональность мне требуется не чаще 1-2 раз в год, поэтому для меня будет полезен онлайн-сервис с постраничной оплатой.
Хочу пожелать команде ABBYY продолжать радовать и удивлять потребителя.
* Для правообладателей:
Материалы, упомянутые в данной статье, были распознаны исключительно в целях проверки функциональности и быстродействия ПО. Все результаты распознавания, равно как и цифровые изображения книжных страниц, были впоследствии безвозвратно уничтожены.
P.S. По поводу вопроса от vmb насчет диакритических знаков. По этой ссылке взят скриншот нижеследующего текста на греческом:
Ἐχεκράτης
[57a] αὐτός, ὦ Φαίδων, παρεγένου Σωκράτει ἐκείνῃ τῇ ἡμέρᾳ ᾗ τὸ φάρμακον ἔπιεν ἐν τῷ δεσμωτηρίῳ, ἢ ἄλλου του ἤκουσας;
Φαίδων
αὐτός, ὦ Ἐχέκρατες.
Ἐχεκράτης
τί οὖν δή ἐστιν ἅττα εἶπεν ὁ ἀνὴρ πρὸ τοῦ θανάτου; καὶ πῶς ἐτελεύτα; ἡδέως γὰρ ἂν ἐγὼ ἀκούσαιμι. καὶ γὰρ οὔτε [τῶν πολιτῶν] Φλειασίων οὐδεὶς πάνυ τι ἐπιχωριάζει τὰ νῦν Ἀθήναζε, οὔτε τις ξένος ἀφῖκται χρόνου συχνοῦ [57b] ἐκεῖθεν ὅστις ἂν ἡμῖν σαφές τι ἀγγεῖλαι οἷός τ᾽ ἦν περὶ τούτων, πλήν γε δὴ ὅτι φάρμακον πιὼν ἀποθάνοι· τῶν δὲ ἄλλων οὐδὲν εἶχεν φράζειν.
который при выборе только греческого языка распознался FineReader-ом вот так:
Έχεκράτης
[57β] αύτός, ώ Φαίδων, παρεγένου Σωκράτει εκείνη τη ήμερα η τό φάρμακον έπιεν έν τώ δεσμωτηρίω, ή άλλου του ήκουσας;
Φαίδων
αύτός, ώ Έχέκρατες.
Έχεκράτης
τί οΰν δή έστιν άττα εΐπεν ό άνήρ προ του θανάτου; καί πώς έτελεύτα; ήδέως γάρ άν έγώ άκούσαιμι. καί γάρ οΰτε [τών πολιτών] Φλειασίων ούδείς πάνυ τι επιχωριάζει τά νυν Άθήναζε, οΰτε τις ξένος άφΐκται χρόνου συχνού [57β] έκεΐθεν όστις άν ήμΐν σαφές τι άγγεΐλαι οΐός τ’ ήν περί τούτων, πλήν γε δή ότι φάρμακον πιών άποθάνοι· τών δέ άλλων ούδέν ειχεν φράζειν.
при выборе греческого и английского — так:
Έχεκράτης
[57a] αύτός, ώ Φαίδων, παρεγένου Σωκράτει εκείνη τη ήμερα η τό φάρμακον έπιεν έν τώ δεσμωτηρίω, ή άλλου του ήκουσας;
Φαίδων
αύτός, ώ Έχέκρατες.
Έχεκράτης
τί οΰν δή έστιν άττα εΐπεν ό άνήρ προ του θανάτου; καί πώς έτελεύτα; ήδέως γάρ άν έγώ άκούσαιμι. καί γάρ οΰτε [τών πολιτών] Φλειασίων ούδείς πάνυ τι επιχωριάζει τά νυν Άθήναζε, οΰτε τις ξένος άφΐκται χρόνου συχνού [57b] έκεΐθεν όστις άν ήμΐν σαφές τι άγγεΐλαι οΐός τ’ ήν περί τούτων, πλήν γε δή ότι φάρμακον πιών άποθάνοι· τών δέ άλλων ούδέν ειχεν φράζειν.
а при создании копии греческого языка и добавлении туда всех символов с диакритическими знаками получилось так:
Έχεκράτης
[57ā] αύτός, ώ Φαίδων, παρεγένου Σωκράτει εκείνη τη ήμερα η τò φάρμακον επιεν έν τω δεσμωτηρίω, ή άλλου του ήκουσας;
Φαίδων
αύτός, ώ Έχέκρατες.
Έχεκράτης
τί οΰν δή έστιν άττα εĩπεν ό άνήρ πρò τοû θανάτου; καί πώς έτελεύτα; ήδέως γάρ αν έγώ άκούσαιμι. καί γάρ οΰτε [τών πολιτών] Φλειασίων ούδεìς πάνυ τι επιχωριάζει τά νûν Άθήναζε, οΰτε τις ξένος άφîκται χρόνου συχνού [57ċ>] έκεîθεν öστις αν ήμîν σαφές τι άγγεΐλαι οîός τ’ ήν περί τούτων, πλήν γε δή öτι φάρμακον πιών άποθάνοι- τών δέ άλλων ούδέν εĩχεν φράζειν.
Сравнение ABBYY FineReader Online и Test The Text
Официальный сайт
Сервис онлайн-распознавания текста и конвертации.
Проверка текста в информационном стиле
Работа с документами
Работа с документами
Кликайте на нужные функции, чтобы выбрать сервис по баллам.
Цены и тарифы
ABBYY FineReader Online
Test The Text
Возможности
Только различияПоказать только различающиеся характеристики
Работа с документами
Отправка
1
Сканирование
0
Поддержка PDF
2
Поддержка документов Word
4
Проверка текста в информационном стиле
0
Безопасность и конфиденциальность
Доступ по протоколу HTTPS
Данные между вами и сервисом передаются по шифрованному каналу (SSL/TLS), что исключает их перехват злоумышленниками.
90
Общие
Платформы
24
Веб-приложение
Веб-приложение
Развёртывание
12
Облако
Облако
Доступные языки
14
Русский
Русский
Кликайте на нужные функции, чтобы выбрать сервис по баллам.
Какой сервис вам подходит?
ABBYY FineReader Online
Test The Text
Оцените, пожалуйста, это сравнение
Сравнение интерфейсов ABBYY FineReader Online и Test The Text
ABBYY FineReader Online
Test The Text
Отзывы о ABBYY FineReader Online и Test The Text
Какой сервис вам подходит?
ABBYY FineReader Online
Test The Text
Официальный сайт
Главная | Larson Tutoring
Летние курсы SAT & ACT
Небольшая группа (3-6 студентов)
Лично (с опцией Zoom)
Стоимость курса: $1440
РЕГИСТРАЦИЯ
SAT: 8-недельный курс
(только увеличение)
5 июля — 23 августа
г.
Среда 15-17 часов
Суббота: 4-недельный курс
1 – 24 августа 90 008
Вторник и четверг: 18–20 часов
PSAT: 6-недельный курс
19 июлячт — 23 августа
г.
Каждую среду с 13:00 до 15:00
Последние два понедельника: 13:00–15:00
ДЕЙСТВИЕ: 4-недельный курс
1-24 августа
Вторник и четверг: 15:30-17:30
Пожалуйста, напишите по электронной почте для частных/полу-частных вариантов
Репетиторство для академического успеха
Мы верим в целостное обучение, которое работает как на ментальном, так и на эмоциональном уровнях и относится к каждому ученику как к личности. Для каждого учащегося мы работаем с семьей, чтобы определить оптимальный план, который поможет их ребенку преуспеть в академической среде. На протяжении всего академического путешествия студента мы здесь, чтобы:
Оказывать поддержку в самых сложных классах
Подготовьте их к тестам PSAT, SAT, ACT
Предложите дополнительный учебный план, если учащийся захочет продвинуться дальше своей обычной курсовой работы или изучить специальные темы
Мы работаем со студентами всех возрастов по телефонам:
Тесты SAT/ACT/PSAT и AP
Математика и естествознание
Методы Ортона-Гиллингема и Линдамуда-Белла для лечения дислексии
Английский язык и письмо
Нарушения обучаемости (дислексия, СДВГ, дискалькулия)
Специальные темы: астрономия, история, философия и дебаты, мировые религии, литература
Эбби Ларсон работает репетитором на полную ставку с 2015 года. Она помогает учащимся во многих областях, уделяя особое внимание математике и естественным наукам в средней школе. У нее тысячи часов опыта подготовки к экзаменам, и она помогла учащимся набрать баллы, необходимые для поступления в очень конкурентоспособные школы. Она работала со многими учениками на протяжении всей их учебы в старшей школе, наставляя их и поддерживая их успехи в учебе. Она имеет степень магистра с отличием Университета Колорадо-Боулдер, где преподавала университетские курсы. Она страстно любит учиться и считает, что культивировать любовь к учебе в других — это величайшая работа, которую она может сделать.
Бретт работает профессиональным педагогом с 2010 года, уделяя особое внимание различиям в обучении, подготовке к экзаменам и грамотности. После получения степени магистра в Университете Наропы он прошел обучение по системе Линдамуда-Белла для работы со студентами с дислексией, СДВГ и другими отклонениями в обучении. В своей работе по подготовке к тесту он учит студентов выявлять тонкие закономерности в тесте и использовать целевые стратегии для эффективного решения различных типов проблем. После работы с Бреттом целеустремленные учащиеся смогли получить отличные и почти идеальные баллы за устные экзамены SAT/ACT. Бретт фокусируется на внимательности со студентами, чтобы развить спокойное и уверенное мышление, необходимое для хорошей работы в реальной тестовой среде.
4-недельный курс SAT
(для августовского теста)
4 — 27 августа
вторник и четверг с 12 до 14:30
РЕГИСТРАЦИЯ
Covid Test | Abby Care
Теперь предлагает экспресс-тестирование на COVID и ПЦР-тестирование!
Приглашаются новые и постоянные пациенты.
Мы по-прежнему открыты для посещения врача, лечения хронических заболеваний и посещения больных, не связанных с жалобами на респираторные заболевания или лихорадкой. Для респираторной помощи или COVID-19симптомы, мы позаботимся о вас виртуально или на стоянке. Мы предлагаем экспресс-тестирование на коронавирус (COVID-19), ПЦР и полное респираторное тестирование.
Коронавирус (COVID-19) Симптомы
Симптомы могут появиться через 2–14 дней после контакта с вирусом. У людей с этими симптомами может быть COVID-19:
Лихорадка или озноб
Кашель
Одышка или затрудненное дыхание
Усталость
Боли в мышцах или теле
Головная боль
Новая потеря вкуса или обоняния
Боль в горле
Заложенность носа или насморк
Тошнота или рвота
Диарея
Ищите предупреждающие знаки о COVID-19.
Если у кого-то проявляются какие-либо из этих признаков, немедленно обратитесь за неотложной медицинской помощью:
Проблемы с дыханием
Постоянная боль или давление в груди
Новая путаница
Неспособность проснуться или бодрствовать
Голубоватые губы или лицо
Вы получили положительный тест на Covid? Щелкните здесь для получения дополнительной информации об уходе на дому.
Наши новые правила техники безопасности
Строго соблюдаемый трехэтапный процесс скрининга, чтобы гарантировать, что никто в наших клиниках не контактирует с людьми с лихорадкой, кашлем, одышкой или другими симптомами коронавируса
В кабинет не допускаются пациенты с лихорадкой или любыми респираторными жалобами (кашель/одышка).
В офис не допускаются сотрудники или врачи с лихорадкой или респираторными жалобами (кашель/одышка).
Залы ожидания, оборудованные для обеспечения соблюдения социальной дистанции
Обширное информирование персонала о рисках передачи и стерильной среде
Виртуальные визиты (телефон/видео) или посещения автостоянки для пациентов с симптомами или из группы риска
О чем мы вас просим
Пожалуйста, будьте честны в процессе проверки. Чтобы поддерживать стерильную среду, мы полагаемся на вашу честность.