Как работать с программой файн ридер: как редактировать документы и распознавать тексты с иероглифами в ABBYY FineReader 15
Содержание
Как мы научили ABBYY FineReader PDF редактировать целые абзацы / Хабр
Сегодня мы обновили ABBYY FineReader 15 и выпустили его под брендом ABBYY FineReader PDF, потому что он объединяет все инструменты для работы с PDF. По этому поводу публикуем первый пост из серии материалов о фичах программы. В нем мы расскажем об одной интересной возможности, которая не первый месяц есть в программе, но, возможно, не все о ней знали.
Давно ли вы открывали PDF-файлы? Готовы поспорить, что совсем недавно. Скорее всего, на вашем компьютере точно найдется пара сканов, а может, еще и макет презентации, аналитическое исследование или техническая инструкция. Для каких задач обычно используют эти документы? По данным опроса ABBYY, 62% респондентов ищут информацию в PDF, 60% — копируют текст из документа, а 52% — редактируют: вносят в файл правки, исправляют ошибки и опечатки.
Даже сейчас не все знают, что можно редактировать текст в PDF. Да, изменение таких файлов устроено не так, как редактирование обычного текстового документа. ABBYY FineReader PDF с многофункциональным текстовым редактором для работы с PDF и сканами позволяет быстро внести изменения прямо в PDF, без утомительной конвертации файла в другие форматы. При редактировании текст в PDF плавно перетекает со строчки на строчку, как в MS Word. Можно добавить или удалить несколько слов, изменить целые абзацы или даже поменять их местами.
В этом посте мы раскроем технические подробности редактирования многострочных фрагментов текста в FineReader: как мы изменили движок программы, как редактирование устроено изнутри и как оно выглядит для пользователя. Поехали!
Форматом PDF пользуются по всему миру: его содержимое одинаково отображается на любых компьютерах, смартфонах и планшетах с разными операционными системами. Это удобно и помогает избежать неловких ситуаций. Например, когда вы написали текст в MS Word, отправили коллегам, а они открывают его LibreOffice’ом или Wordpad’ом, и все поехало и начинается веселье. PDF, конечно, в этом плане удобнее, но с текстом здесь все сложно. В 70% всех существующих PDF-документов текст есть, а в 30% — нет, так как это изображения.
Поговорим сначала о PDF, в которых текст есть. Чтобы редактировать PDF, надо понимать, как в нем записан текст. Открывали когда-нибудь PDF в блокноте? Если да, то вы видели такое:
Чтобы все это отображалось понятно для пользователя, нужно проделать большую работу.
Задача: понять PDF
Содержимое каждой страницы в PDF-файле хранится в виде потоков команд для отрисовки документа – это могут быть текст, изображения или векторная графика. Структуру файла определяют PDF-объекты, например, страница, картинка, комментарий (а абзацы, строчки текста и буквы – это всего лишь части объекта). Символ в PDF представляется глифом. То, как они записаны, определяется шрифтом. Каждый символ хранится отдельно: у него есть шрифт, код символа в шрифте и координаты его расположения на странице. То, где глифы расположены, определяется как раз потоком команд. Кроме того, буквы объединены в потоки текста (text run), но они не смысловые.
В PDF нет ни строк, ни абзацев, которые есть в документах текстовых форматов. Даже порядок текста не всегда определен. То есть вы видите текст, но на самом деле текста не существует. Это хаос из трудно понятных инструкций (как на изображении выше), которые нужно правильно отобразить в конкретных местах документа, с соответствующим форматированием.
«А как же текст?» – спросите вы.
Текст в PDF все же существует, и его даже получится редактировать. Для этого мы учим наши технологии понимать структуру текста, например, определять и выделять строки. Расскажем об этом подробнее.
Библиотеки PDF и как мы их поменяли
Чтобы сделать возможным редактирование целых абзацев, мы сильно поменяли нашу внутреннюю подсистему (библиотеку), которую мы называем PdfTools. Она занимается тем, что открывает PDF-файлы, парсит потоки команд (т.е. понимает, где расположен текст, где картинки, и воссоздает структуру документа) и помогает пользователям оперировать этими данными: прочитать, изменить, сохранить в PDF.
Подсистема PdfTools содержит все необходимые инструменты, чтобы прочитать содержимое и обернуть его в объекты (страница, картинка, комментарий), с которыми удобно работать программе. С этими объектами уже могут работать наши продукты, в частности ABBYY FineReader PDF и другие.
Как было раньше. В FineReader 14 мы умели редактировать текст только в рамках одной строчки. После редактирования необходимо было выполнить «рендеринг» — расставить глифы на свои новые места.
Вообще рендеринг — это визуализация. Но мы вкладываем в это слово иное понятие — расположение объектов в PDF на своих местах. Для PDF-специалистов это и есть визуализация, которую больше никто не видит. Когда мы говорим о визуализации в привычном понимании, то используем слово «растеризация».
Весь этот процесс располагался в подсистеме PdfTools. Она помогала нам собирать содержимое PDF в строчки и редактировать их. Например, надо поставить на 5-ое месте глиф «А». FineReader передавал подсистеме PdfTools, что на пятое место нужно поставить глиф «А» с заданным размером и шрифтом, а PdfTools вставляла «А» и перемещала на нужное место в строчке все глифы, которые следовали за буквой «А». Построчное редактирование довольно легкое: текст просто смещался вправо или, например, влево, если он записан на иврите или арабском языке. Это позволяло внести небольшие корректировки, например, исправить опечатку, но не давало возможность сделать более глобальные изменения в тексте PDF-документа.
Что решили изменить. Когда появилась задача многострочного редактирования, мы поняли, что в рамках одной библиотеки PdfTools это будет проблематично делать. Нам необходимо было научиться автоматически находить в тексте PDF более крупные фрагменты, например, «видеть» абзацы, понимать, где находятся их границы, какое форматирование должно быть у целого фрагмента текста и что происходит при переходе с одной строки на другую. Чтобы определить все эти параметры, мы решили привлечь для решения этой задачи и другие наши OCR-технологии — Document Analysis (DA) и Synthesis, которые умеют строить структуру документа.
Document Analysis и Synthesis
Чтобы определять в тексте блоки, ABBYY FineReader PDF использует технологию Document Analysis. Она позволяет найти абзацы, таблицы, картинки. Программа подсвечивает найденные блоки небольшими бледными рамками, чтобы пользователю удобнее было вносить правки:
Далее мы усовершенствовали другую подсистему нашей программы – Synthesis. Мы уже рассказывали на Хабре, зачем она нужна. Если вкратце, именно она определяет структуру и все характеристики распознанного текста: какие используются шрифты и размеры, какое начертание (bold, italic, underline), где заголовки, списки, отступы и многие другие параметры, которые можно настраивать в том же MS Word. Мы доработали Synthesis для того, чтобы при распознавании и воссоздании страницы очень точно восстанавливать исходные параметры текста.
Особенности подчеркнутого текста
В PDF нет такого атрибута текста как подчеркивание, привычного, например, пользователям MS Word. Подчеркивание в PDF – это векторная графика, никак не связанная с текстом. Без дополнительной доработки продукта при редактировании «подчеркнутого» текста символы бы перемещались привычным образом, а линии, обозначающие подчеркивания, оставались бы на месте. ABBYY FineReader PDF умеет определять и редактировать подчеркнутый текст привычным пользователю образом.
Редактирование таблиц в PDF
Изменилось и редактирование таблиц. Раньше программа «видела» таблицу, как отдельные строки, и редактировала ее так же. Теперь при работе с таблицами ABBYY FineReader PDF определяет содержимое каждой ячейки, умеет извлекать из них текст и работать с ним. Это удобно, когда надо исправить ошибку в цифре, поменять точку на запятую и при этом сохранить структуру таблицы, сделать это быстро и без конвертации PDF-документа в другие форматы.
Как отредактировать скан?
Возможность многострочного редактирования доступна и для сканов. Кстати, пользователю даже не надо задумываться, скан перед ним или нет. ABBYY FineReader PDF сам определит это и запустит нужные механизмы. Например, в дате договора — опечатка, или ФИО контрагента поменялось: оно стало длиннее и должно «перетечь» на следующую строчку.
В программе скан сначала распознается, а потом происходит подготовка к редактированию. Когда скан распознали, то текст получается не в нашем исходном документе, а в его виртуальном «двойнике». И именно в нем происходят все операции по редактированию.
Когда пользователь закончил редактировать документ, программа автоматически собирает все изменения со страницы и заменяет эти фрагменты в исходном документе. Наша задача — встроить текст обратно в PDF-документ, не повредив все то остальное, что уже есть в нем.
Редактирование скана позволяет не тратить время на конвертацию документа в другие форматы и обратно. Это удобно, когда нужно быстро внести забытую правку в дату или другой фрагмент текста.
Пример многострочного редактирования. Текст автоматически перераспределяется по строкам по мере добавления слов и предложений внутри абзаца.
Вместо заключения
Исправить опечатку в листовке, поменять местами текстовые блоки в инструкции, изменить целый абзац в скане договора или добавить несколько новых, поправить форматирование всего текста – все эти задачи теперь возможно решить:
- быстро,
- без конвертации документа,
- с помощью одной программы.
Попробовать можно прямо сейчас – скачайте триал-версию ABBYY FineReader PDF бесплатно.
В следующем посте через неделю мы расскажем о том, как научили ABBYY FineReader PDF еще одной интересной фиче и для чего может пригодиться новая функциональность.
Пишите в комментариях, о каких еще технологических особенностях нашей программы вам было бы интересно узнать?
ABBYY FineReader 14 Business (Per Seat, 1-2) — Группа компаний «АВИ-Центр»
ABBYY FineReader 14 Business (Per Seat, 1-2) — Группа компаний «АВИ-Центр»
?>
Запрос обратного звонка
×
Установка программы, обновление, загрузка необходимых баз
Быстро установим ПК ГРАНД-Смета на ваш компьютер
При выходе обновлений ПК ГРАНД-Смета, сами свяжемся с вами и обновим вашу программу (до последнего релиза текущей версии или до последней версии, при наличии действующей лицензии на обновление)
Загрузим необходимые нормативные базы, территориальные единичные расценки (ТЕР), индексы и ценники (при наличии лицензий на названные продукты)
×
Обучение, помощь в работе с программой, обеспечение нормативной документацией
Проведем вводный курс обучения по работе в ПК ГРАНД-Смета
Проконсультируем, поможем преодолеть трудности, с которыми вы сталкиваетесь при работе с программой ГРАНД-Смета
При выходе обновлений, продемонстрируем новые функции ПК ГРАНД-Смета
Вовремя обеспечим необходимой нормативно-технической документацией по ценообразованию и сметному нормированию в РФ, Республике Крым и в г. Севастополь.
Пригласим на вебинары, мастер-классы и семинары по новым, эффективным методам работы в ГРАНД-Смете (в собственном оборудованном учебном классе)
×
Исправление ошибок, восстановление работоспособности программы и ключей
При сбое компьютера, восстановим работоспособность ПК ГРАНД-Смета
При выходе из строя ключа ПК ГРАНД-Смета, произведем его замену (в соответствии с регламентом производителя), перенесем данные с одного ключа на другой.
×
Внедрение iiko на предприятии общественного питания под ключ
Установим и настроим программный комплекс iiko под потребности именно вашего предприятия.
Подключим торговое и кассовое оборудование, настроим оптимальный режим работы. Приведем работу предприятия в соответствие с законодательством.
×
Обучение, помощь в работе с программой, обеспечение нормативной документацией
Проведем вводный курс обучения по работе в iikoOffice и iikoFront.
Научим пользоваться системой эффективно.
Расскажем, как начать зарабатывать с iiko еще больше.
Создадим резервные копии и перенос данных в случае необходимости. Настроем регулярное резервное копирование.
×
Исправление ошибок, восстановление работоспособности программы и ключей
При сбое компьютера, сервера или кассы, восстановим работоспособность iiko.
Исправим ошибки в работе персонала.
×
Установка программы, обновление, загрузка необходимых баз
Быстро установим ГОССТРОЙСМЕТА на ваш компьютер
При выходе обновлений ГОССТРОЙСМЕТА, сами свяжемся с вами и обновим вашу программу (до последнего релиза текущей версии или до последней версии, при наличии действующей лицензии на обновление)
Загрузим необходимые нормативные базы, территориальные единичные расценки (ТЕР), индексы и ценники (при наличии лицензий на названные продукты)
×
Обучение, помощь в работе с программой, обеспечение нормативной документацией
Проведем вводный курс обучения по работе в ГОССТРОЙСМЕТА
Проконсультируем, поможем преодолеть трудности, с которыми вы сталкиваетесь при работе с программой ГОССТРОЙСМЕТА
При выходе обновлений, продемонстрируем новые функции ГОССТРОЙСМЕТА
Вовремя обеспечим необходимой нормативно-технической документацией по ценообразованию и сметному нормированию в РФ, Республике Крым и в г. Севастополь.
Пригласим на вебинары, мастер-классы и семинары по новым, эффективным методам работы в ГОССТРОЙСМЕТА (в собственном оборудованном учебном классе)
×
Исправление ошибок, восстановление работоспособности программы и ключей
При сбое компьютера, восстановим работоспособность ГОССТРОЙСМЕТА
При выходе из строя ключа ГОССТРОЙСМЕТА, произведем его замену (в соответствии с регламентом производителя), перенесем данные с одного ключа на другой.
×
Установка программы, обновление, загрузка необходимых баз
Быстро установим Smeta.RU на ваш компьютер
При выходе обновлений Smeta.RU, сами свяжемся с вами и обновим вашу программу (до последнего релиза текущей версии или до последней версии, при наличии действующей лицензии на обновление)
Загрузим необходимые нормативные базы, территориальные единичные расценки (ТЕР), индексы и ценники (при наличии лицензий на названные продукты)
×
Обучение, помощь в работе с программой, обеспечение нормативной документацией
Проведем вводный курс обучения по работе в Smeta. RU
Проконсультируем, поможем преодолеть трудности, с которыми вы сталкиваетесь при работе с программой Smeta.RU
При выходе обновлений, продемонстрируем новые функции Smeta.RU
Вовремя обеспечим необходимой нормативно-технической документацией по ценообразованию и сметному нормированию в РФ, Республике Крым и в г.Севастополь.
Пригласим на вебинары, мастер-классы и семинары по новым, эффективным методам работы в Smeta.RU (в собственном оборудованном учебном классе)
×
Исправление ошибок, восстановление работоспособности программы и ключей
При сбое компьютера, восстановим работоспособность Smeta.RU
При выходе из строя ключа Smeta.RU, произведем его замену (в соответствии с регламентом производителя), перенесем данные с одного ключа на другой.
×
Установка программы, обновление, загрузка необходимых баз
Внедрим розничный учет предприятия на базе 1С:Розница под ключ как в одном магазине так и в сети магазинов.
Установим и настроим программное обеспечение 1С:Розница под потребности именно вашего предприятия.
Поставим, подключим и обслужим необходимое торговое и кассовое оборудование, настроим оптимальный режим работы. Приведем работу предприятия в соответствие с законодательством. Обучим персонал
×
Обучение, помощь в работе с программой, обеспечение нормативной документацией
Проведем полный курс обучения по работе с 1С:Розница.
Научим пользоваться системой эффективно.
Создадим резервные копии и перенос данных в случае необходимости. Настроим регулярное резервное копирование.
×
Исправление ошибок, восстановление работоспособности программы и ключей
При сбое компьютера, сервера или кассы, восстановим работоспособность рабочего места кассира в 1С:Розница.
Всегда в наличии подменный фонд оборудования
×
PDF Embedder requires a url attribute
×
ЛИЦЕНЗИЯ ФСТЭК НА ДЕЯТЕЛЬНОСТЬ ПО ТЕХНИЧЕСКОЙ ЗАЩИТЕ КОНФИДЕНЦИАЛЬНОЙ ИНФОРМАЦИИ (ТЗКИ)
Серия КИ 0317 №015945 Рег. № 3752 от «22» апреля 2020 г.
×
ABBYY FineReader PDF — Soluma
Узнайте, как FineReader PDF помогает решать ежедневные проблемы с документами на цифровом рабочем месте.
Оптимизация процессов обработки документов
Оцифровывайте, извлекайте, редактируйте, защищайте, делитесь и совместно работайте над всеми видами документов в рамках одного рабочего процесса.
Получите максимум от PDF-файлов
Редактируйте цифровые и отсканированные PDF-файлы с новой легкостью: исправляйте целые предложения и абзацы или даже изменяйте макет.
Оцифровка документооборота
Включите бумажные документы в цифровое рабочее место с помощью технологии OCR на основе искусственного интеллекта, чтобы упростить повседневную работу.
Оптимизация затрат на ИТ
Воспользуйтесь преимуществами единовременного платежа и прогрессивных оптовых скидок, чтобы максимально увеличить эффективность вашей организации.
Стандартизация программных активов
Разверните единое решение PDF во всей организации, чтобы обеспечить бесперебойную совместную работу нескольких заинтересованных сторон.
Упрощение управления лицензиями
Снижение рабочей нагрузки на ИТ благодаря автоматическому развертыванию и простому управлению лицензиями.
Типы лицензий, адаптированные к потребностям организации
НА МЕСТО
Стандартная или Корпоративная
Одна лицензия, одно устройство, неограниченное использование
Отличный выбор для компаний, которым приходится ежедневно обрабатывать и редактировать документы.
СОВМЕСТНАЯ
Корпоративная
Сетевая лицензия
Отличный выбор для компаний, которые только изредка обрабатывают и редактируют документы.
Каждый сотрудник имеет возможность доступа и использования ABBYY FineReader PDF 15
Количество одновременных лицензий ограничивает количество пользователей, которые могут работать с FineReader PDF
одновременно.
УДАЛЕННЫЙ ПОЛЬЗОВАТЕЛЬ
Стандартная или корпоративная
Лицензия, назначенная физическому лицу
Для компаний и организаций. Для использования FineReader PDF с решениями виртуализации.
Поддерживает виртуализацию рабочих столов и приложений.
Пользователь может получить доступ к лицензии через использование виртуального рабочего стола «удаленно».
Индивидуальные лицензии
Стандарт
- Простое, быстрое и интерактивное редактирование
- Удаление конфиденциальных данных, защита безопасности, цифровая подпись
- Преобразование документа в PDF и из PDF в выбранный формат
- Оцифровка физических документов с использованием передовой технологии OCR
- Базовая поддержка клиентов *
Корпоративный
- Сравнение документов разных форматов
- Автоматизация процессов преобразования
+
- Простое, быстрое и интерактивное редактирование
- Удаление конфиденциальных данных, защита безопасности, цифровая подпись
- Преобразование документа в PDF и из PDF в выбранный формат
- Оцифровка физических документов с использованием передовой технологии OCR
- Базовая поддержка клиентов *
FineReader PDF для Mac®
- Преобразование файлов PDF
- Оцифровка физических документов с использованием передовой технологии OCR
- Захват документов через iPhone®
- Комплексный пользовательский интерфейс, адаптированный к продуктам Apple
- Базовая поддержка клиентов *
*Мы отвечаем на ваши вопросы по возможности в рабочее время (мы стараемся ответить вам как можно скорее, но не обещаем немедленных ответов)
Если у вас есть какие-либо вопросы относительно ABBYY FineReader PDF или цен на лицензии, пожалуйста, свяжитесь с нами и нашим команда ответит вам как можно скорее.
Свяжитесь с нами
Partners
Недавно мы работали с компанией Soluma, которая показала отличные результаты в сценариях извлечения отдельных позиций. Их знания и опыт помогли в сборе данных исследований по оценке затрат и выгод и позволили нам определить ключевые показатели эффективности для процессов реализации проекта. Профессионализм Soluma был исключительным и обеспечил максимальное удовлетворение и успех для нашего клиента. Мы более чем счастливы работать с SOLUMA и очень рекомендуем их.
Лаура Стэнсфилд, директор по работе с клиентами
UiPath
Мы нашли надежного партнера для проектов сбора данных в SOLUMA. Их компетентность и опыт дают ответы на все требования бизнеса. SOLUMA с ABBYY Flexi Capture — это эффективная комбинация для различных проектов сбора данных, особенно для автоматизации процесса расчетов с поставщиками. Это твердый продукт!
Милан Бабич, менеджер по продукту
РКЛ Интерн. д.о.о.
Мы искали решение для автоматического извлечения заголовков и отдельных позиций из сложных немецких счетов. SOLUMA добилась потрясающих результатов с помощью конструктора шаблонов Soluma, и я с радостью рекомендую его. SOLUMA имеет важное значение для наших усилий по развитию.
Мартин Бачик, управляющий директор
Ancore Services
Дизайнер шаблонов SOLUMA — это эффективный инструмент для разработки и распространения шаблонов. Я определенно рекомендую этот инструмент всем системным интеграторам или поставщикам профессиональных услуг, которые хотели бы сократить затраты на разработку и выделиться среди других на рынке.
Михал Грепл, портфельный менеджер ITS
Konica Minolta CEE
Мы очень довольны SOLUMA. Это сотрудничество позволило нам предоставить дополнительные бизнес-решения нашим премиальным клиентам в государственном и финансовом секторах. Индивидуальные решения SOLUMA, интегрированные со сканирующими устройствами Konica Minolta, могут удовлетворить практически любой бюджет и бизнес-требования клиента.
Мирза Мерзич, генеральный директор
Konica Minolta Business Solutions Босния и Герцеговина
Мы выбрали SolumaInvoiceReader.com в качестве платформы для чтения счетов и преобразования документов для решения SOLARIA BPM SaaS. Процесс интеграции прошел гладко, и решение очень простое в использовании. Надежность системы и отличные результаты распознавания представляют собой дополнительную ценность для наших клиентов и продвигают наше решение на конкурентном рынке BPM. Спасибо СОЛУМА!
Горазд Бизжак, генеральный директор
Bizis
Они знают все секреты технологии Flexi Capture. Назовите требования, и они разработают решение. SOLUMA — надежный партнер с многолетним опытом работы в проектах по сбору данных. Мы очень рады работать с SOLUMA.
Офек Рон, генеральный директор
Источники программного обеспечения
Давайте поговорим, вместе мы сможем изменить ситуацию.
Отправьте нам сообщение и узнайте, как наша инновационная и преданная своему делу команда может помочь вам создать подлинное и лучшее решение.
Одно сообщение. Без обязательств.
Примечание: для этого контента требуется JavaScript.
OCR Функция ABBYY FineReader для ScanSnap
ABBYY FineReader для ScanSnap — это приложение, используемое исключительно со ScanSnap. Его можно использовать для распознавания текста текстовой информации в изображении в формате PDF документа, отсканированного с помощью ScanSnap, и преобразования изображения в файл Word, Excel или PowerPoint.
В этом разделе описаны возможности и примечания к функции преобразования текстовой информации в изображение с помощью ABBYY FineReader for ScanSnap.
Возможности функции оптического распознавания символов ABBYY FineReader для ScanSnap
Параметры, которые нельзя воспроизвести в том виде, в каком они представлены в исходном документе
Документы и символы, которые могут быть неправильно распознаны
Прочие примечания
Возможности функции OCR программы ABBYY FineReader для ScanSnap
Функция OCR программы ABBYY FineReader для ScanSnap имеет следующие особенности. Перед преобразованием изображения проверьте содержимое изображения, которое необходимо преобразовать.
Приложение, используемое для преобразования | Документы, пригодные для преобразования | Документы, не подходящие для преобразования |
---|---|---|
Сканировать в Word | Документы, созданные с использованием простого макета страницы с одним или двумя столбцами. | Документы, такие как брошюры, журналы и газеты, созданные с использованием сложной компоновки страниц, состоящей из следующего:
|
Сканировать в Excel | Документы с простыми таблицами, в которых каждая граница соединяется с внешней рамкой. | Документы, содержащие следующее:
|
Сканировать в PowerPoint(R) | Документы, состоящие только из символов и простых графиков или таблиц на белом или светлом одноцветном фоне. |
|
Параметры, которые не могут быть воспроизведены в исходном документе
Следующие параметры не могут быть воспроизведены в исходном документе. Проверьте преобразованные файлы с помощью Word, Excel или PowerPoint и при необходимости отредактируйте их.
Шрифт и размер символов
Междустрочный и межстрочный интервал
Подчеркнутые, полужирные и курсивные символы
Символы верхнего/нижнего индекса
Документы и символы, которые могут распознаваться неправильно
Следующие типы документов и символов могут распознаваться неправильно.
Их можно распознать, если отсканировать их, изменив цветовой режим или улучшив качество изображения в настройках профиля.
Документы, содержащие рукописные символы
Документы с мелкими символами размером менее 10 pt.
Перекошенные документы
Документы, написанные на языках, отличных от указанного языка
Документы с символами на неравномерно окрашенном фоне, например, с заштрихованными символами.
Документы с большим количеством декоративных символов, таких как рельефные или контурные символы
Документы с символами на узорчатом фоне, такими как символы, перекрывающие иллюстрации или диаграммы
Документы, в которых много символов касается подчеркивания или границ
Документы со сложной компоновкой и документы с шумом изображения (Распознавание текста для этих документов может занять дополнительное время.)
Другие примечания
Когда документ большого размера на бумаге преобразуется в файл Word, он может быть преобразован в файл с максимальным размером бумаги, допустимым для Word.
При преобразовании документа в файл Excel, если результаты распознавания превышают 65536 строк, строки после 65536-й строки не сохраняются.
При преобразовании документа в файл Excel макет всего документа, диаграммы, графики, а также высота и ширина таблиц не воспроизводятся.