Текстовые редакторы и программы распознавания образов

Автор: Пользователь скрыл имя, 15 Ноября 2011 в 12:47, курсовая работа

Краткое описание

Целью нашего курсового проекта является организация ввода текстовой информации.
Задачи курсового проекта:
ознакомиться с назначением устройств ввода
изучить классификацию устройств ввода
рассмотреть текстовые редакторы и программы распознавания образов
сделать выводы на основе изученной работы.

Оглавление

Введение 3
Глава 1. Ввод текстовой и графической информации 5
1.1. Назначение и классификация устройств ввода 5
1.2 Виды и характеристики сканеров 14
Глава 2. Текстовые редакторы и программы распознавания образов 22
2.1 Блокнот 23
2.2 Microsoft word. 23
2.3 Программа Acrobat Reader 26
2.4 WordPerfect 30
2.5 Fine Reader 32
Выводы и предложения 37
Список использованной литературы 39

Файлы: 1 файл

Организация ввода текстовой информации.doc

— 432.00 Кб (Скачать)

2.3 Программа Acrobat Reader

       Программа Acrobat Reader предназначена для просмотра  файлов формата Portable Document Format (pdf), который  широко распространен в компьютерном мире и используется в разных операционных системах и на разных платформах. В  этот формат легко преобразуются документы формата PostScript. Файлы формата pdf очень часто встречаются в Сети. Не обязательно иметь возможность создавать такие файлы (программы их создания распространяются на коммерческой основе), но уметь их читать надо. Как раз для этого и служит программа Acrobat Reader фирмы Adobe Systems Incorporated, распространяемая бесплатно как в версии для Windows, так и в версиях для UNIX, и в частности для Linux. В настоящее время версия 4.05 этой программы для Linux может быть бесплатно получена на сайте фирмы http://www.adobe.com (для Windows уже выложена версия 5.0).

       Для установки программы Acrobat Reader 4.05 вам  потребуется 12 Мбайт дискового пространства, а для работы с программой — 32 Мбайт ОЗУ. Если у вас была установлена версия 3.0 этой программы, ее необходимо предварительно удалить.

       Прежде  чем начать установку, выберите один из двух возможных вариантов установки: сетевой или локальный (на отдельном  компьютере).

       Локальная инсталляция гарантирует вам  доступ к программе на данном компьютере и может обеспечить значительно большую производительность (особенно в сравнении с работой по загруженной сети). Для локальной инсталляции Вы, естественно, должны иметь право записи в тот каталог, куда будет устанавливаться программа [4].

       Сетевая инсталляция облегчает решение задач администрирования и поддержки программы, особенно в тех случаях, когда программу используют многие пользователи. Очевидно, что легче осуществлять обновление одного экземпляра программы на сервере, чем обновлять множество копий на отдельных компьютерах. Сетевая инсталляция должна выполняться администратором сервера.

       Однако  сетевая инсталляция имеет и  некоторые недостатки. Сервер должен быть высоконадежным и инсталлируемые файлы должны быть установлены в  каталог, который должен монтироваться одинаковым образом (в одну и ту же точку монтирования) на всех рабочих станциях сети.

       По  умолчанию программа Acrobat Reader устанавливается  в каталог /usr/local/Acrobat4.

       Если  вы получили файл с программой Acrobat Reader с Web-сайта, требуется вначале разархивировать установочные файлы с помощью программ gunzip и tar. После этого вам необходимо перейти в каталог, содержащий установочный скрипт и запустить его:

       [root]# ./INSTALL

       Инсталляционный скрипт выводит на экран несколько  вопросов, в частности о том, в какой каталог разместить файлы программы. На каждый вопрос предлагается вариант ответа, который можно принять, просто нажав клавишу <Enter>. Если предлагаемый по-умолчанию ответ вас не устраивает, введите собственный вариант ответа. В остальном надо просто следовать инструкциям, выдаваемым программой установки. Если вы где-то ошиблись, можно прервать установку комбинацией <Ctrl>+<C> и начать все заново.

       В конце концов, появляется сообщение  о том, что установка успешно  завершена (естественно, по-английски, что-то вроде "installed successfully").

       После установки в том каталоге, куда вы установили программу (напомню, что  по-умолчанию это /usr/local/Acrobat4), создаются  несколько подкаталогов:

       каталог bin содержит скрипт для запуска программы,

       каталог Reader содержит файлы подсказки и  некоторые платформенно-зависимые  файлы (смотри примечание ниже),

       каталог Fonts содержит шрифты,

       каталог Browsers содержит скрипт для запуска Acrobat Reader из браузера Netscape.

Рисунок 4. Окно програмы Acrobat Reader

       Если  вы введете команду acroread <filename>, когда Reader уже запущен, активная копия Reader отобразит заданный файл.

       Если  вы хотите получить подсказку по использованию  программы, введите одну из команд

       [user]$ acroread -help

       [user]$ acroread -helpall

       С помощью программы Acrobat Reader вы можете преобразовать файлы формата PDF в  файлы формата PostScript уровней 1 или 2 при условии, что вы делаете это в командной строке графического режима. Для этого надо выполнить примерно следующую команду:

       [user]$ cat sample.pdf | acroread -toPostScript > sample.ps

       С помощью аналогичных команд (более  подробное описание, которых вы сможете найти в документации к программе) можно преобразовывать сразу группу файлов [11].

       Для обратного преобразования PDF-файла  в файл формата PostScript уровня 2, надо набрать следующую команду:

       [user]$ acroread -toPostScript -level2 pdf_file_1

2.4 WordPerfect

       WordPerfect 8, который из текстового редактора  для DOS превратился в богатую  возможностями систему, которая  в равной степени подходящую  как для людей, профессионально  занимающихся издательской деятельностью, так и для рядовых необученных пользователей.

       WordPerfect—единственный текстовый процессор, позволяющий осуществлять просмотр. Центральное место в офисном комплекте занимает текстовый процессор и редактирование документа на уровне кодов форматирования. Окно Reveal Codes (Показ кодов форматирования) предназначено для визуального представления структуры документа и ее «отладки». Любой код может быть удален или исправлен. Чтобы изменить стиль, нужно дважды щелкнуть по прямоугольнику, соответствующему коду изменения стиля шрифта, после чего в диалоге можно будет изменить абсолютно любые его настройки.

       Вообще, управление оформлением документа  и его структурой существенно  удобнее, чем в других редакторах. К примеру, где еще можно в  одной строке разместить три фразы, каждая из которых будет иметь индивидуальное выравнивание (влево, по центру и вправо)? При этом не нужно рисовать таблицу или прибегать к другим хитростям. Другое новшество—это возможность начинать ввод текста с любого места на странице. Не требуется десять раз нажимать Enter и пять раз Tab, чтобы в нужном месте на первой странице написать слово «Реферат». Установив указатель мыши в приглянувшееся место, необходимо просто щелкнуть, и можно начинать ввод текста. Для удобства «прицеливания» WordPerfect имеет кроме основного курсора, обозначающего позицию вставки текста, еще и теневой курсор (Shadow Cursor), который при перемещении указателя мыши по экрану показывает место, откуда начнется ввод текста, если нужен ввод с произвольной позиции. Он и в самом деле похож на тень, следующую за курсором [7].

       Другим  объектом, который следит за происходящим на экране, является динамический объект Property Bar, который отображается в виде небольшого объекта слева от начала абзаца или от выбранного объекта. Если на нее нажать, то появится контекстно-чувствительный диалог, в котором можно быстро установить параметры текущего элемента. Никаких правых кнопок мыши и Alt+Enter.

       Замечательная функция Fit Expert досталась по наследству от предыдущих версий WordPerfect. Она позволяет разместить набранный текст на требуемом числе страниц. Например, документ нужно уместить на трех листах, а он занимает пять. Fit Expert проанализирует текст и оформление, подберет шрифты, изменит поля страницы и расстояние между строками так, чтобы весь текст разместился-таки, на трех страницах и еще осталось чуть-чуть места. Пользователь может выбирать те элементы оформления документа, которые могут быть изменены.

       В WordPerfect возможно создавать виртуальные подстраницы на одной физической странице, чего также пока нет ни в одном другом процессоре. Подстраницы могут пригодиться для тех, кто хочет быстро создать буклет на имеющейся бумаге. Текст будет размещен процессором WordPerfect таким образом, что после печати буклета на стандартных листах бумаги останется только согнуть получившуюся стопку бумаги и скрепить ее страницы, используя оставленное для этого поле. Нумерация страниц в получившемся буклете будет правильной, текст не будет, перевернут, а бумага будет использована оптимальным образом [9].

       С помощью экспресс-форматирования текста (QuickFormat) можно быстрее, чем в других текстовых процессорах, правильно  оформить различные части документа. Не нужно для каждого участка текста явно указывать стиль или характеристики, достаточно сказать «запомни это оформление» и указать фрагменты текста или абзацы для форматирования по аналогии. В дальнейшем при изменении стиля одного абзаца все остальные будут следовать команде «делай как я».

       В новой версии WordPerfect улучшены возможности  групповой работы над документом. Раньше каждый, кто вносил дополнения и изменения в документ, оставлял «след» — его изменения подсвечивались и указывались инициалы (или полное имя) автора изменений. Автор документа по окончании работы с ним мог согласиться с изменениями или отказаться от их внесения в окончательную версию документа. Теперь, кроме этого, WordPerfect предоставляет возможность полнофункционального управления версиями документа и черновиками. В документе же может быть сохранена позиция редактирования текста, чтобы после его открытия пользователь сразу попал в нужное место (функция QuickMark).

       В целом текстовый процессор можно  с уверенностью назвать одним  из лучших по оценке возможностей и удобству работы. Спектр выполняемых функций и операций перекрывает все, что есть у конкурентов и, кроме того, в WordPerfect присутствуют многие пока уникальные функции. Рядом с ним можно поставить разве что Lotus WordPro, который по количеству новинок сравним с WordPerfect, но по удобству работы и функциональному набору текстовый редактор от Corel лидирует с сильным отрывом.

2.5 Fine Reader

       На  данный момент существует огромное количество программ, поддерживающих распознавание  текста как одну из возможностей. Мы не будем рассматривать такие системы, как AutoCAD, так как распознавание текста не является их основной задачей. Начнем обзор с лидера в этой области — FineReader. Это программный продукт фирмы ABBYY Software, раньше разрабатывался фирмой Bit Software. Последняя версия программы (6.0) теперь имеет средства для разработки новых систем на базе технологии FineReader 6.0. В состав семейства FineReader 6.0 теперь входят FineReader 6.0 Professional, FineReader 6.0 Corporate Edition, FineReader Scripting Edition 6.0 и FineReader Engine 6.0. FineReader 6.0, кроме того, что знает огромное количество форматов для сохранения, включая PDF, имеет возможность прямого распознавания из PDF-файлов. Новая технология Intelligent Background Filtering (интеллектуальной фильтрации фона) позволяет отсеять информацию о текстуре документа и фоновом шуме изображения: иногда для выделения текста в документе используется серый или цветной фон. Человеку это не мешает читать, но обычные алгоритмы распознавания текста испытывают серьезные затруднения при работе с буквами, расположенными поверх такого фона. Теперь программа FineReader умеет определять зоны, содержащие подобный текст, отделяя текст от фона документа, находя точки, размер которых меньше определенной величины, и удаляя их. При этом контуры букв сохраняются, так что точки фона, близко расположенные к этим контурам, не вносят помех, способных ухудшить качество распознавания текста. Используя все возможности современных программ верстки, дизайнеры часто создают объекты сложной формы, такие, как обтекание непрямоугольной картинки многоколоночным текстом. В FineReader 6.0 реализована поддержка распознавания таких объектов и их сохранение в файлах формата MS Word. Теперь документы сложной верстки будут точно воспроизведены в этом текстовом редакторе. Даже таблицы распознаются с максимальной точностью, сохраняя при этом все возможности для редактирования.

       ABBYY FormReader — еще одна программа распознавания образов от ABBYY, основанная на ABBYY FineReader Engine. Эта программа предназначена для распознавания и обработки форм, которые могут быть заполнены вручную. Производители утверждают, что программа ABBYY FormReader может обрабатывать формы с фиксированной схемой так же хорошо, как и формы, чья структура может меняться. Для распознавания была применена новая технология ABBYY FlexiForm technology.

       ABBYY FineReader 7.0 Professional Edition - новая версия популярной системы оптического распознавания текста (OCR). FineReader - идеальное решение для тех, кому нужно быстро и точно переводить бумажные документы или PDF-файлы в редактируемый формат с максимально полным сохранением исходного оформления документа. Высокое качество распознавания, простота в использовании и широкие возможности российской программы FineReader получили признание профессионалов во всем мире [6].

       Что нового в этой версии программы. Новая версия FineReader сочетает в себе все возможности современной OCR-системы с непревзойденной точностью распознавания и легкостью использования. В новой версии улучшено качество распознавания и сохранение оформления документа, повысилась точность распознавания PDF-файлов, включены профессиональные возможности, доступные прежде только пользователям корпоративной версии, появились новые форматы сохранения результатов распознавания: Microsoft Word XML и Microsoft PowerPoint.

       Улучшенный  анализ и сохранение оформления документа. В ABBYY FineReader 7.0 улучшен анализ документа  и сохранение элементов его оформления при экспорте во внешние приложения. Основные области, в которых достигнуты улучшения:

       Документы со сложными таблицами. Сложные таблицы, например, таблицы без разделителей или таблицы с цветными ячейками теперь распознаются лучше.

       Сохранение  в HTML. Улучшено сохранение сложных элементов форматирования в формате HTML.

       Маркированные списки. FineReader точно воспроизводит различные типы маркированных списков при сохранении результатов распознавания в Microsoft Word.

       Точность  распознавания PDF-файлов возросла на 45%. FineReader извлекает текст из особого слоя PDF-файла (если он доступен) и использует его для проверки результатов распознавания [10].

       Созданные в FineReader PDF-файлы оптимизированы для  публикации в Интернете: первые страницы многостраничного документа будут доступны для чтения сразу же, в то время как остальные страницы продолжают загружаться на компьютер.

Информация о работе Текстовые редакторы и программы распознавания образов