ABBYY. Abbyy тест
ABBYY TestReader помог оперативно и точно обработать результаты ЕГЭ и Г(И)А
Успешные проекты
ABBYY TestReader помог оперативно и точно обработать результаты ЕГЭ и Г(И)А
Просмотреть или скачать версию для печати (PDF 102 kb)
«ЕГЭ и Г(И)А – ответственные проекты, имеющие большое значение для российской системы образования. Для нас важно, что технологии ABBYY способствуют проведению такого масштабного мероприятия. Компания ABBYY со своей стороны прикладывает все усилия по совершенствованию системы обработки результатов ЕГЭ, чтобы школьники по всей России как можно быстрее получали результаты тестирования».
Юрий Корюкин,директор по корпоративным проектам ABBYY Россия
«АИС “Г(И)А” предоставляет широкие возможности для оперативной обработки результатов и мониторинга проведения Г(И)А. Использование системы несёт в себе целый ряд преимуществ. Так, система не требует значительных финансовых вложений и отличается гибкостью настройки: её с лёгкостью можно адаптировать к существующем в регионе условиям подготовки экзаменационных материалов и схемам обработки результатов тестирования. Кроме того, для работы с АИС “Г(И)А” используются схожие с системой ЕГЭ шаблоны, как, например, формат бланков и структура тестов. Это позволяет школьникам лучше подготовиться к сдаче ЕГЭ».
Сергей Пономаренкодиректор ФГУ «Федеральный центр тестирования»
Технологии ABBYY обеспечили оперативную и качественную проверку более 3 миллионов экзаменационных бланков выпускников 11 и 9 классов российских школ.
Введение
В 2010 году компания ABBYY в сотрудничестве с ФГУ «Федеральный центр тестирования» (ФЦТ) обеспечила обработку результатов ЕГЭ и государственной (итоговой) аттестации (Г(И)А) выпускников 11 и 9 классов образовательных учреждений.
Технологии ABBYY уже 10 лет используются при проведении ЕГЭ, и в этом году сотрудничество с ФЦТ получило дальнейшее развитие: результаты Г(И)А 9 классов впервые были обработаны с применением технологий распознавания. Теперь решения ABBYY задействованы в проведении двух основных государственных экзаменов, оценивающих знания школьников России – для обработки экзаменационных материалов выпускников была использована система ABBYY TestReader. В этом году с её помощью было обработано около 3,3 миллионов работ.
Г(И)А: детали проекта
Г(И)А 9 классов, оценивающая знания девятиклассников, в этом году впервые прошла с использованием автоматизированной информационной системы. Г(И)А в новой форме (по формату ЕГЭ) проводится с 2002 года в экспериментальном режиме и входит в зону ответственности региональных органов управления образованием. Аттестация призвана обеспечить независимую и объективную систему оценки образования в России. В 2009 году ФЦТ поставил задачу по разработке автоматизированной информационной системы с целью её дальнейшего распространения во всех регионах России.
В результате реализации проекта компания ABBYY и ФГУ «Федеральный центр тестирования» выпустили совместный продукт – Автоматизированную информационную систему «Государственная (итоговая) аттестация» (АИС «Г(И)А»), в состав которой вошли решения ABBYY TestReader 5.1 Network и ABBYY TestReader 5.0 Desktop. По функциональным особенностям АИС «Г(И)А» во многом аналогична системе, применяемой при обработке результатов ЕГЭ, что позволяет для работы с ней использовать уже существующую аппаратную базу и привлекать тех же сотрудников, что и при проведении ЕГЭ, без необходимости предварительного обучения. Налаженные в регионах технологические процессы и накопленный опыт значительным образом снижают как материальные, так и организационные издержки во время обработки результатов экзамена.
Уже в мае и июне 2010 года система была успешно использована при обработке результатов Г(И)А. Аттестация проводилась в два этапа – тренировочный и основной, по итогам которых система обработала 65 и 200 тысяч работ соответственно. Контрольно-измерительные материалы были подготовлены специалистами ФЦТ и Федерального института педагогических измерений. Бланки, используемые при проведении экзамена, предварительно разработаны специалистами ABBYY и имеют схожую с бланками ЕГЭ структуру.
ЕГЭ: модернизация системы обработки результатов экзаменов
Уже второй год подряд ЕГЭ проводится во всех школах России, и ABBYY в сотрудничестве с Федеральным центом тестирования Федеральной службы по надзору в сфере образования и науки продолжает совершенствовать систему обработки экзаменационных работ: в 2010 году был принят целый ряд мер по увеличению скорости обработки данных и повышению информационной безопасности.
В целях повышения скорости обработки была оптимизирована работа серверной части, сокращено количество ручных операций для некоторых видов бланков, а также введены новые режимы сканирования, призванные в первую очередь уменьшить простой сканеров в процессе обработки бланков. Вследствие этого на обработку результатов экзаменов по одному обязательному предмету ABBYY TestReader тратил не более 5 дней, тогда как при ручном вводе данных тем же составом проверяющих результаты были бы получены только через несколько месяцев. Обработка каждого предмета по выбору занимала еще меньше времени – от 2 до 3 дней. В целом по итогам основного этапа ЕГЭ ABBYY TestReader обработал 12,6 миллионов страниц (3 миллиона экзаменационных работ по 14 предметам). Число школьников, сдававших ЕГЭ в 2010 году, превысило 900 тысяч человек. Всего же за 10 лет проведения ЕГЭ при помощи ABBYY TestReader было обработано около 60 миллионов бланков (стопка высотою около 6 тысяч метров).
Особое внимание было уделено повышению информационной безопасности. В частности, специалисты ABBYY разработали программу мониторинга, позволяющую руководителям региональных центров обработки информации (РЦОИ) тщательнее контролировать процесс обработки результатов экзаменов. Кроме того, стал строже учитываться расход индивидуальных экзаменационных комплектов ЕГЭ: система в автоматизированном режиме фиксирует поступление партии комплектов в субъект РФ и контролирует их последующие раздачу и возврат в пункты проведения экзамена. В целях предотвращения нецелевого использования экзаменационных комплектов пристальное внимание уделяется испорченным и неиспользованным бланкам. Также в 2010 году был усилен контроль за действиями операторов в РЦОИ, непосредственно работающих с бланками, – теперь, если результаты были некорректно изменены, система позволяет отследить, на каком этапе и кем это было сделано.
trainee.abbyy.ru
Сертификационный экзамен по продуктам ABBYY FineReader, ABBYY Lingvo и ABBYY PDF Transformer.
On-line сертификация по продуктам ABBYY FineReader, ABBYY Lingvo и ABBYY PDF Transformer
|
Сертификация партнёров - это экзамен на знание продуктов ABBYY. Пройдя on-line тест по продуктам ABBYY FineReader, ABBYY PDF Transformer и ABBYY Lingvo и набрав не менее 80% правильных ответов, вы получите «Сертификат специалиста». С ним ваша компания сможет участвовать в Партнерской программе ABBYY.
Внимание! Проходить сертификационный экзамен можно не более 4 раз, поэтому мы рекомендуем хорошо подготовиться, прежде чем начинать выполнять задания нашего теста. А именно:
- Внимательно прочитать разделы Help, файлы Readme и руководства пользователя продуктов ABBYY FineReader, ABBYY PDF Transformer и ABBYY Lingvo;
- Изучить раздел Tutorial программы ABBYY FineReader;
- Просмотреть действующий прайс-лист компании ABBYY и информацию, содержащуюся на сайте www.abbyy.ru.
Пройти тестирование по массовым продуктам
certificate.abbyy.ru
Download Trial
ABBYY- Contacts
- Store
-
Select Region
Global Global Web Site English North America Canada English Mexico Español United States English South America Brazil Português South America Español
Europe
France Français Germany Deutsch Italy Italiano United Kingdom English Spain Español Western Europe English Central and Eastern Europe English Croatia Hrvatski Czech Republic Čeština Hungary Magyar Poland Polski Romania Română Russia Русский Slovakia Slovenčina Ukraine Українська Africa and Asia China 中文 India and SEA Countries English Israel עברית Japan 日本語 Middle East English South Korea 한국어 Turkey Türkçe Australia Australia English - Submit
- Products INDIVIDUAL PRODUCTIVITY
www.abbyy.com
Тестирование ABBYY FineReader 11 / Хабр
Недавно вышла 11-я версия известного в России и в мире программного продукта по оптическому распознаванию текста ABBYY FineReader. В этой версии анонсировано множество улучшений, а основной упор делается на увеличение производительности и снижение ошибок. Эти улучшения — в сравнении с 10-й версией. Я же не пользовался этой программой со студенческих лет (с начала 2000-х), и наверняка пропустил версий, эдак, шесть. В те годы интернет и мобильные технологии не были развиты так сильно, а времени было много. Поэтому я был готов брать в библиотеке книгу на час, снимать копии, ехать в один конец города к компьютеру, где есть сканер, затем в другой конец, туда, где есть FineReader, а затем домой, доисправлять ошибки распознавания и форматирования в Word-овских файлах. Сегодня же юзер стал ленивее и требовательнее, поэтому хочу рассмотреть работу с программой в ракурсе современных доступных технологий и острой нехватки времени. Спасибо dimonline и компании ABBYY за промо-ключ и версию FineReader 11 CE (Corporate Edition), благодаря которым удалось провести несколько тестов.
Тест функциональности
Итак, я взял книгу-путеводитель «Швейцария» и под определенным углом сфотографировал на iPhone несколько разворотов. Один из разворотов:Итого я снял 14 фотографий, которые достаточно быстро перенес на ноутбук. Конфигурация ноутбука: MacBook Pro 15" / Core i7 2.66 GHz / RAM 8GB / Mac OS X Lion, а сам FineReader запущен на VMware Fusion / Windows 7 x64 (выделено 2 ядра процессора и 2 GB RAM). Запустил FineReader, выбрал функцию «Файл (изображение) в PDF», выбрал файлы, нажал «Открыть» и перешел в другое окно заниматься своими делами. Примерно через 15 минут характерный звук уведомил об окончании процесса и готовый PDF файл с распознанными страницами предстал пред моим взором. Вот, как выглядит одна из страниц в самом файле:
тем не менее, текст выделяется:
и в блокноте выглядит так:
Далее, я зашел в редактирование изображений и устранил трапециевидное искажение путем указания расположения углов прямоугольной страницы. К сожалению, на моих страницах дополнительно присутствуют сферические искажения. В целом, страница и ее картинки стали выглядеть геометрически правильно, но распознавание текста не изменилось. Тогда я сфотографировал страницу со вспышкой, держа телефон строго вертикально над книгой. В итоге имею такую страницу в PDF:
и выделенный текст неплохо читается в блокноте:
Старинная народная мудрость в действии — лучше качественно снимать, чем потом ретушировать, а точнее — потратить несколько минут на подготовку съемочного места (свет, фон) и оборудования (мегапиксели, фокус), а потом наслаждаться автоматизированным (тут ABBYY постарались) процессом распознавания.
Тест производительности
В домашней библиотеке нашелся 500-страничный мануал по некой компьютерной программе (251-страничный PDF-файл), взятый в просторах интернета. Дабы не накликать себе гнев богов копирайта соблюсти условия пользования интеллектуальной собственностью скриншоты не вставляю. Страницы сфотографированы с небольшими сферическими искажениями в области переплета. Много картинок и таблиц. Картинки, в основном, — это скриншоты из собственно описанной программы. Результаты теста таковы:Из недочетов можно отметить только один — большинство картинок определены как текстовые блоки. Возможно, потому, что на этих картинках скриншоты, включающие в себя строку заголовка и меню программы. Для этого пришлось зайти на каждую страницу с картинкой и поменять тип и границы блоков.
Время корректировки типов блоков: 35 минут.
Выводы
Я решил сделать выводы по каждому из анонсированных улучшений.Более точное определение типов блоков Оно, действительно, более точное, но многие картинки определились как текст, хотя имеют прямоугольную форму и множество «не-текста». Возможно, программе требуется дополнительная функциональность в виде настройки чувствительности, некий ползунок со шкалой, на одной стороне шкалы надпись «скорее текст», а на другой — «скорее картинка».Более стабильная работа с большими (более 100 файлов) пакетами документов Да, действительно, несмотря на то, что программа выполнялась на виртуальной машине со множеством параллельно запущенных программ, процесс шел стабильно, без сбоев. Для верности распознавание 500-страничного документа было осуществлено 3 раза.Улучшенное автоматическое и ручное исправление искажений сфотографированных документов Ручное исправление работает, в то время как автоматических изменений замечено не было. Хотя, текст на искаженной странице распознался корректно. А ведь раньше (лет 10 назад) малейшее искажение неизбежно приводило к ошибкам.Улучшенная работа с многостраничными документами Особых проблем в работе с многостраничным документом подмечено не было.Наличие режимов сохранения в PDF: «Наилучшее качество», «Небольшой размер» и «Сбалансированный режим» Такие режимы есть, но места на диске и мощности комьютера достаточно для «Наилучшего качества».Сохранение и конвертирование изображений документов и PDF-файлов в формат ODT (OpenOffice.org Writer), DjVu, ePub, fb2 Вполне полезные и актуальные функции.Редактор стилей Эта функция полезна для постобработки. Если цель распознавания — просто читать, а не распечатывать, то пользоваться функцией небязательно.В окно «Новая задача» вынесены функции, которые бывают нужны чаще всего Многие программы с древнейших времен имеют такие окна. Я всегда их закрывал и ставил галочку «Больше не выводить это окно». Но в данном случае решил воспользоваться (возможно, сказался переход на Mac и iPhone) и мне понравилось, с тех пор в FineReader пользовался только этим окном. А лазать по меню стало лень.Заключение
Юзабилити вполне в современном тренде и софтом приятно пользоваться. Определенной категории офисных работников она сильно сэкономит время и нервы. Заявленные улучшения действительно работают. Если бы я снова оказался студентом, то просто фотографировал бы отрывки книг на телефон в библиотеке и распознавал дома (для рефератов и диссертаций). Сейчас же подобная функциональность мне требуется не чаще 1-2 раз в год, поэтому для меня будет полезен онлайн-сервис с постраничной оплатой.Хочу пожелать команде ABBYY продолжать радовать и удивлять потребителя.
* Для правообладателей: Материалы, упомянутые в данной статье, были распознаны исключительно в целях проверки функциональности и быстродействия ПО. Все результаты распознавания, равно как и цифровые изображения книжных страниц, были впоследствии безвозвратно уничтожены.
P.S. По поводу вопроса от vmb насчет диакритических знаков. По этой ссылке взят скриншот нижеследующего текста на греческом:
Ἐχεκράτης [57a] αὐτός, ὦ Φαίδων, παρεγένου Σωκράτει ἐκείνῃ τῇ ἡμέρᾳ ᾗ τὸ φάρμακον ἔπιεν ἐν τῷ δεσμωτηρίῳ, ἢ ἄλλου του ἤκουσας;
Φαίδων αὐτός, ὦ Ἐχέκρατες.
Ἐχεκράτης τί οὖν δή ἐστιν ἅττα εἶπεν ὁ ἀνὴρ πρὸ τοῦ θανάτου; καὶ πῶς ἐτελεύτα; ἡδέως γὰρ ἂν ἐγὼ ἀκούσαιμι. καὶ γὰρ οὔτε [τῶν πολιτῶν] Φλειασίων οὐδεὶς πάνυ τι ἐπιχωριάζει τὰ νῦν Ἀθήναζε, οὔτε τις ξένος ἀφῖκται χρόνου συχνοῦ [57b] ἐκεῖθεν ὅστις ἂν ἡμῖν σαφές τι ἀγγεῖλαι οἷός τ᾽ ἦν περὶ τούτων, πλήν γε δὴ ὅτι φάρμακον πιὼν ἀποθάνοι· τῶν δὲ ἄλλων οὐδὲν εἶχεν φράζειν.
который при выборе только греческого языка распознался FineReader-ом вот так:
Έχεκράτης [57β] αύτός, ώ Φαίδων, παρεγένου Σωκράτει εκείνη τη ήμερα η τό φάρμακον έπιεν έν τώ δεσμωτηρίω, ή άλλου του ήκουσας;
Φαίδων αύτός, ώ Έχέκρατες.
Έχεκράτης τί οΰν δή έστιν άττα εΐπεν ό άνήρ προ του θανάτου; καί πώς έτελεύτα; ήδέως γάρ άν έγώ άκούσαιμι. καί γάρ οΰτε [τών πολιτών] Φλειασίων ούδείς πάνυ τι επιχωριάζει τά νυν Άθήναζε, οΰτε τις ξένος άφΐκται χρόνου συχνού [57β] έκεΐθεν όστις άν ήμΐν σαφές τι άγγεΐλαι οΐός τ’ ήν περί τούτων, πλήν γε δή ότι φάρμακον πιών άποθάνοι· τών δέ άλλων ούδέν ειχεν φράζειν.
при выборе греческого и английского — так:
Έχεκράτης [57a] αύτός, ώ Φαίδων, παρεγένου Σωκράτει εκείνη τη ήμερα η τό φάρμακον έπιεν έν τώ δεσμωτηρίω, ή άλλου του ήκουσας;
Φαίδων αύτός, ώ Έχέκρατες.
Έχεκράτης τί οΰν δή έστιν άττα εΐπεν ό άνήρ προ του θανάτου; καί πώς έτελεύτα; ήδέως γάρ άν έγώ άκούσαιμι. καί γάρ οΰτε [τών πολιτών] Φλειασίων ούδείς πάνυ τι επιχωριάζει τά νυν Άθήναζε, οΰτε τις ξένος άφΐκται χρόνου συχνού [57b] έκεΐθεν όστις άν ήμΐν σαφές τι άγγεΐλαι οΐός τ’ ήν περί τούτων, πλήν γε δή ότι φάρμακον πιών άποθάνοι· τών δέ άλλων ούδέν ειχεν φράζειν.
а при создании копии греческого языка и добавлении туда всех символов с диакритическими знаками получилось так:
Έχεκράτης [57ā] αύτός, ώ Φαίδων, παρεγένου Σωκράτει εκείνη τη ήμερα η τò φάρμακον επιεν έν τω δεσμωτηρίω, ή άλλου του ήκουσας;
Φαίδων αύτός, ώ Έχέκρατες.
Έχεκράτης τί οΰν δή έστιν άττα εĩπεν ό άνήρ πρò τοû θανάτου; καί πώς έτελεύτα; ήδέως γάρ αν έγώ άκούσαιμι. καί γάρ οΰτε [τών πολιτών] Φλειασίων ούδεìς πάνυ τι επιχωριάζει τά νûν Άθήναζε, οΰτε τις ξένος άφîκται χρόνου συχνού [57ċ>] έκεîθεν öστις αν ήμîν σαφές τι άγγεΐλαι οîός τ’ ήν περί τούτων, πλήν γε δή öτι φάρμακον πιών άποθάνοι- τών δέ άλλων ούδέν εĩχεν φράζειν.
habr.com
Бета-тестирование лингвистического портала ABBYY Lingvo.Pro / Блог компании ABBYY / Хабр
А вот и обещанный сюрприз :)Компания ABBYY запускает бета-тестирование нового лингвистического портала Lingvo.Pro и приглашает вас принять в нем участие. Чем Lingvo.Pro отличается от привычного вам Lingvo Online?
1. Большое количество текстов с примерами переводов. Зачем они нужны? Любой словарь (тот же Lingvo) может давать несколько переводов одного и того же слова. Без примеров употребления сложно понять, какой перевод подойдёт в том или ином случае. Нa Lingvo.Pro собраны примеры из реальных текстов с переводами (параллельных текстов), их много, и чуть позже такие примеры смогут добавлять сами пользователи.
Для найденных в словарях переводов слова вы можете посмотреть примеры употребления в окне примеров.
Например, escape – бежать
Или escape – избавление
2. Lingvo.Pro даёт возможность поискать перевод только в примерах, не используя словари вообще, – вдруг найдётся то самое значение, которого вам так не хватало :) (закладка «Примеры).
3. Добавление собственных переводов. Пока можно добавлять отдельные переводы, но уже очень скоро появится функция загрузки параллельных текстов и целых глоссариев. А ещё через некоторое время можно будет оценить и обсудить каждый новый (и старый) перевод – а вдруг вам покажется, что он неправильный?
4. Пословный перевод. Если в предложении вам встретилось сразу несколько незнакомых слов, вы можете ввести все предложение или словосочетание в строку ввода, и программа выдаст вам перевод каждого слова.
5. Расширенный поиск – поиск в примерах слова с его конкретным переводом. Например, вы хотите найти предложения, в которых слово table переведено как «таблица»…
6. Поиск с учётом регистра. Объяснять, наверное, не надо. :)
В будущем на Lingvo.Pro мы планируем развивать и другие полезные сервисы:
1. Pretranslate/Претранслейт Как это будет работать: если вам, например, нужно перевести предложение или документ с русского на английский, вы загружаете его на Lingvo.Pro, и система начинает искать каждое предложение в базе параллельных текстов. Если переводы найдутся, система подставит их вместо русского текста и выдаст вам готовый результат.
2. Система управления корпоративной терминологией Создание на портале единой базы многоязычных терминов, использующихся в конкретной организации. Сотрудники организации смогут искать переводы в базе, в словарях Lingvo и параллельных текстах, обсуждать их и при необходимости – обновлять.
3. Комьюнити вокруг переводческой темы С Lingvo.ru «переедет» форум, будет перезапущен сервис «Вопрос-ответ» (можно будет спрашивать у других пользователей переводы слов, а ответы будут сразу добавляться в базу переводов).
4. Работа в онлайне со всеми словарями, доступными в десктопной версии Lingvo. Сейчас на Lingvo.Pro есть только те бесплатные словари, что и на Lingvo Online, но через некоторое время можно будет докупать словари.
Чтобы принять участие в тестировании, пройдите по ссылке и следуйте инструкциям :)
Поделитесь с нами вашими впечатлениями о Lingvo.Pro: что понравилось, что не понравилось, каких функций вам не хватает на портале, какие можно улучшить. Это можно сделать с помощью специальной формы
Авторы самых интересных и полезных идей получат призы – коды лицензий к ABBYY Lingvo x3 Европейская версия.
Удачи!
Татьяна Парфентьева Департамент лингвистических продуктов
habr.com
ABBYY Produkte | Testversionen
ABBYY- Kontakt
- Online Shop
-
Region wählen
Global Global Web Site English North America Canada English Mexico Español United States English South America Brazil Português South America Español
Europe
France Français Germany Deutsch Italy Italiano United Kingdom English Spain Español Western Europe English Central and Eastern Europe English Croatia Hrvatski Czech Republic Čeština Hungary Magyar Poland Polski Romania Română Russia Русский Slovakia Slovenčina Ukraine Українська Africa and Asia China 中文 India and SEA Countries English Israel עברית Japan 日本語 Middle East English South Korea 한국어 Turkey Türkçe Australia Australia English - Abschicken
- Produkte
www.abbyy.com
Testing engineer (ABBYY Text Analytics)
ABBYY- Contacts
- Store
-
Select Region
Global Global Web Site English North America Canada English Mexico Español United States English South America Brazil Português South America Español
Europe
France Français Germany Deutsch Italy Italiano United Kingdom English Spain Español Western Europe English Central and Eastern Europe English Croatia Hrvatski Czech Republic Čeština Hungary Magyar Poland Polski Romania Română Russia Русский Slovakia Slovenčina Ukraine Українська Africa and Asia China 中文 India and SEA Countries English Israel עברית Japan 日本語 Middle East English South Korea 한국어 Turkey Türkçe Australia Australia English - Submit
- Products INDIVIDUAL PRODUCTIVITY FineReader for Windows Edit, convert, and compare PDFs and scans.
www.abbyy.com