Содержание статьи
- 1 Сканирование изображения в Word
- 2 Вставка отсканированного текста в Word
- 3 Платные и бесплатные программы
- 4 Разрешение
- 5 Как отсканировать документ в Word
- 6 Как сканировать через смартфон, используя Office Lens
- 7 Как отсканировать документ перед редактированием?
- 8 Как это работает
- 9 Как отредактировать отсканированный документ – работа с OCR-утилитами
- 10 Решение задачи с помощью OCR
Примечание: Мы стараемся как можно оперативнее обеспечивать вас актуальными справочными материалами на вашем языке. Эта страница переведена автоматически, поэтому ее текст может содержать неточности и грамматические ошибки. Для нас важно, чтобы эта статья была вам полезна. Просим вас уделить пару секунд и сообщить, помогла ли она вам, с помощью кнопок внизу страницы. Для удобства также приводим ссылку на оригинал (на английском языке) .
Если имеющаяся печатного документа или рисунок, который нужно вставить в документ Word, существует несколько способов, вы можете сделать это.
Примечание: Если вы ищете инструкции о том, как подключить сканер или копирование Microsoft Windows, посетите веб-сайт поддержки производителя для своего устройства.
Сканирование изображения в Word
Чтобы отсканировать изображение в документ Word, воспользуйтесь сканера, многофункциональный принтер, цифровой камеры или копирование с возможностью поиска.
Отсканируйте изображение или сделайте его снимок с помощью цифровой камеры или смартфона.
Сохраните изображение в стандартном формате, таком как JPG, PNG или GIF. Поместите его в папку на своем компьютере.
В Word поместите курсор в которой вы хотите вставить отсканированное изображение и на ленте вкладку Вставка, нажмите кнопку рисунки.
Выберите свое отсканированное изображение из диалогового окна и нажмите кнопку Вставить.
Вставка отсканированного текста в Word
Лучший способ сканирование документа в Microsoft Word будет использовать наши бесплатное приложение Office Lens на смартфоне или планшете. Используется камеру вашего устройства на получение сведений о документе, можно сохранять непосредственно в формате Word как редактируемый документ. Доступно для бесплатной на iPad, iPhone, Windows Phone и Android.
Если вы не хотите использовать Office Lens, следующий лучшим вариантом будет сканировать документ в формате PDF с помощью собственного сканер и повторно откройте PDF-файл в Word.
В Word выберите Файл > Открыть.
Перейдите в которой хранится PDF-файл и откройте его.
Word откроется диалоговое окно подтверждающее, что он будет предназначенную для импорта текста в PDF-файл. Нажмите кнопку ОК, чтобы подтвердить, а Word будет импортирована текст. Word сделаем максимальной эффективностью для сохранения исходного форматирования текста, которое отображается в формате PDF.
Примечание: Точность распознавания текста зависит от качества сканирования и четкости отсканированного текста. Рукописный текст редко распознается, поэтому для лучших результатов сканируйте печатные материалы. Всегда проверяйте текст после его открытия в Word, чтобы убедиться, что он правильно распознан.
Кроме того, со сканером может поставляться приложение для распознавания текста (OCR). Обратитесь к документации своего устройства или к его производителю.
Платные и бесплатные программы
OCR CuneiForm
Бесплатная программа для распознавания сканированного текста, которую можно скачать здесь.
Приложение было разработано в 1993 году в компании Cognitive Technologies. Одной из главных особенностей ее на тот момент была возможность опознавания смеси русского и английского языков. В 2009 году была добавлена ветка, которая позволяет распознавать смесь других языков. Программный продукт поставлялся со сканерами и МФУ от ведущих производителей: Hewlet-Pachard, Epson, Xerox и т.д. Последняя версия вышла в 2009 году. После скачивания и установки пробуем распознать текст. Для примера возьмем эту статью.
Разрешение
Чтобы вставить отсканированное изображение в документ Word 2010, выполните указанные ниже действия.
Использование программного обеспечения, включенного в сканер, для сканирования и сохранения образа на компьютере.
Запишите путь к сохраненному изображению.
Откройте Word 2010.
Нажмите кнопку Вставить, а затем выберите Рисунок.
В поле Вставка рисунка перейдите к папке, содержащей сохраненный образ.
Выберите изображение и нажмите кнопку Вставить.
Как отсканировать документ в Word
- В первую очередь происходит сканирование документа. Для этого дела лучше выбирать формат png или jpg. Размер изображения также должен быть внушительным (от 400 dpi), чтобы при распознавании не было никаких проблем.
- Полученные изображения сохраняются в конкретном месте, после чего потребуется сама программа для распознавания текста. Лучше всего сделать выбор в пользу Adobe FineReader. Это универсальное программное обеспечение, которое по качеству своей работы не вызывает никаких нареканий. Важно отметить, что после установки данной программы соответствующая вкладка должна появиться и в MS Word, соответственно, использование функционала существенно упрощается.
- Через Adobe FineReader нужно выбрать пункт меню «Файл» и «Открыть», выбираем необходимые изображения. Далее появится меню обработки изображения, нам необходимо выбрать язык, который используется в документе, а также некоторые другие опции, среди которых словари и прочие настройки (не столь важные для получения результата).
- Нажимаем кнопку «Распознать» и ждем, пока процесс завершится. Вполне вероятно, что распознается далеко не все, поэтому те слова, которые программа не смогла определить, будут выделены другим цветом, их можно редактировать прямо в программе.
- Если текст в самом отсканированном документе немного смещен, то в Adobe FineReader необходимо выбрать те или иные абзацы текста при помощи выделения. Это позволит не пропустить текст при распознавании.
- В итоге нужно нажать на кнопку «Сохранить», после чего появляется возможность выбрать место сохранения документа, а также его формат. Конечно же, в случае с MS Word нужно выбирать расширение doc или docx.
- Если перед сохранением оказывается, что документ разбит на несколько колонок, то необходимо выбрать меню «Формат», далее перейти в «Колонки» и выбрать «Одна», чтобы документ смотрелся просто и гармонично. Также в «Параметрах страницы» присутствует возможность настройки полей, отступов и шрифтов.
Как сканировать через смартфон, используя Office Lens
Как отсканировать документ перед редактированием?
Чтобы успешно манипулировать файлом в дальнейшем, важно правильно перевести его в формат “картинки”, а также учесть несколько простых, но полезных нюансов в самом процессе. Для этого:
- Разгладьте все заломы и складки, чтобы они не отобразились на скане и не привели к трудностям в распознавании букв.
- Для удобства обращения сохраните файл в формате PDF, JPG или TIFF.
- PDF-документ можно будет открыть и редактировать программой Adobe Acrobat (или любой другой, предназначенной для подобных целей).
- Зайдите на сайт компании-создателя сканера, либо поищите фирменную программу на прилагавшемся диске (часто известные бренды имеют собственные приложения для изменения отсканированных страниц).
- Для последующего использования файла в MS Office 2003 или 2007, установите утилиту Microsoft Office Document Scanning. Она производит конвертацию сканируемого файла автоматически, переводя его сразу в текст (программа не работает с более “свежими” версиями Офиса).
- Рекомендуется сканировать в черно-белой гамме, а не в цветной – это упрощает анализ текста.
- TIFF формат лучше всего применять для OCR конвертеров, то есть программ, производящих оптическое распознавание.
Как это работает
Оптическое распознавание текста (OCR — Optical Character Recognition) – это возможность преобразовать текст из графического вида (фото, скан, pdf) в обычный формат. Преобразованный текст можно редактировать. Любая растровая картинка состоит из точек. Программное обеспечение для распознавания выделяет на картинке буквы и переводит их в текст. Происходит анализ структуры документа. Выделяются текстовые блоки. Затем строятся линии, которые делятся на слова, а далее на символы. Каждый символ сравнивается с шаблонами. После чего строятся гипотезы, что это за символ. Исходя их них, ПО анализирует разные варианты разбиения строк на слова, а слова на символы. Количество таких гипотез огромно. В конец концов программа принимает решение и выдает текст.
Как отредактировать отсканированный документ – работа с OCR-утилитами
Принцип метода Optical Character Recognition — считывание имеющихся на бумаге символов, их последующее сравнение с элементами из собственной базы данных. Таким образом происходит преобразование сплошной картинки в редактируемый текст. Яркие примеры программ, справляющихся с данной задачей – Adobe Acrobat и Evernote. Чтобы внести исправления в имеющийся скан, просто откройте его одним из таких приложений, весь последующий процесс произойдет автоматически. Когда программа закончит распознавание, то предложит пользователю сохранить документ в одном из доступных форматов.
Для запуска процесса:
Данная программа автоматом выделит фрагменты документа, рисунки и таблицы, при необходимости повернет сканированный текст по нужному направлению. После завершения сканирования, в данной программе требуется выбрать язык для расшифровки написанного.Выбрать его можно в выпадающем окне «Язык документа», если загруженный скан будет написан на нескольких иностранных языках – следует выбрать автоматический режим.
Решение задачи с помощью OCR
Если вам нужно редактирование отсканированных документов, то воспользуйтесь любой программой OCR, функция которой заключается в оптическом распознавании символов. Данное ПО сравнивает символы в отсканированном файле с теми символами, которые имеются в его БД. После этого, программа данной категории производит конвертацию файла в удобный текстовый формат
Однако примите во внимание, что далеко не все OCR способны работать на бесплатной основе – среди них есть немало и платных вариантов. Также учтите, что в зависимости от того, насколько качественно вам удастся выполнить сканирование оригинала, вы можете столкнуться с различными ошибками, редактируя готовый скан
Чтобы решить непосредственно задачу связанную с тем, как редактировать сканированный текст следуйте следующей инструкции:
- Загрузите программу OCR с официального сайта разработчика или любого надежного веб-ресурса и установите ее.
- Откройте редактируемый файл в окне программы. Данный процесс может отличаться для каждого ПО подобного типа, но в целом от вас потребуется открыть файл, после чего запустить процесс конвертации. Во многих таких программах можно выбирать подходящий формат выходного файла. Главное, чтобы измененный тип документ был удобен для вас.
- После произведенной конвертации вам нужно будет удалить из готового файла форматирование, если с ним возникли какие-то проблемы. Дело в том, что ПО может учесть форматирование, к примеру, шрифты, межстрочные интервалы, если сканируемый файл отсканируется недостаточно ровно. Чтобы удалить форматирование используйте любой текстовый редактор, к примеру, обычный «Блокнот». Он, как правило, не способен распознавать форматирование, благодаря чему вставить текст в него можно без лишнего кода.
- В конце вам нужно открыть новый документ в любом удобном редакторе и приступить к такому процессу, как редактирование сканированных документов. Обязательно воспользуйтесь функцией проверки орфографии, чтобы вовремя найти все ошибки и устранить их. Но ошибки, связанные с форматированием, придется исправлять ручным образом.
Но прежде чем включить сканер и отсканировать тот или иной текст, вам стоит изначально определиться с удобной для вас программой оптического распознавания символов. Далее можно ознакомиться с одними из самых популярных и распространенных среди них: