Как перевести отсканированный документ в Word. Как отсканированный документ перевести в формат Word

Примечание: Мы стараемся как можно оперативнее обеспечивать вас актуальными справочными материалами на вашем языке. Эта страница переведена автоматически, поэтому ее текст может содержать неточности и грамматические ошибки. Для нас важно, чтобы эта статья была вам полезна. Просим вас уделить пару секунд и сообщить, помогла ли она вам, с помощью кнопок внизу страницы. Для удобства также приводим ссылку на оригинал (на английском языке) .

Если имеющаяся печатного документа или рисунок, который нужно вставить в документ Word, существует несколько способов, вы можете сделать это.

Примечание: Если вы ищете инструкции о том, как подключить сканер или копирование Microsoft Windows, посетите веб-сайт поддержки производителя для своего устройства.

Сканирование изображения в Word

Чтобы отсканировать изображение в документ Word, воспользуйтесь сканера, многофункциональный принтер, цифровой камеры или копирование с возможностью поиска.

Отсканируйте изображение или сделайте его снимок с помощью цифровой камеры или смартфона.

Сохраните изображение в стандартном формате, таком как JPG, PNG или GIF. Поместите его в папку на своем компьютере.

В Word поместите курсор в которой вы хотите вставить отсканированное изображение и на ленте вкладку Вставка, нажмите кнопку рисунки.

Выберите свое отсканированное изображение из диалогового окна и нажмите кнопку Вставить.

Вставка отсканированного текста в Word

Лучший способ сканирование документа в Microsoft Word будет использовать наши бесплатное приложение Office Lens на смартфоне или планшете. Используется камеру вашего устройства на получение сведений о документе, можно сохранять непосредственно в формате Word как редактируемый документ. Доступно для бесплатной на iPad, iPhone, Windows Phone и Android.

Если вы не хотите использовать Office Lens, следующий лучшим вариантом будет сканировать документ в формате PDF с помощью собственного сканер и повторно откройте PDF-файл в Word.

В Word выберите Файл > Открыть.

Перейдите в которой хранится PDF-файл и откройте его.

Word откроется диалоговое окно подтверждающее, что он будет предназначенную для импорта текста в PDF-файл. Нажмите кнопку ОК, чтобы подтвердить, а Word будет импортирована текст. Word сделаем максимальной эффективностью для сохранения исходного форматирования текста, которое отображается в формате PDF.

Примечание: Точность распознавания текста зависит от качества сканирования и четкости отсканированного текста. Рукописный текст редко распознается, поэтому для лучших результатов сканируйте печатные материалы. Всегда проверяйте текст после его открытия в Word, чтобы убедиться, что он правильно распознан.

Кроме того, со сканером может поставляться приложение для распознавания текста (OCR). Обратитесь к документации своего устройства или к его производителю.



Платные и бесплатные программы

OCR CuneiForm

Бесплатная программа для распознавания сканированного текста, которую можно скачать здесь.

Приложение было разработано в 1993 году в компании Cognitive Technologies. Одной из главных особенностей ее на тот момент была возможность опознавания смеси русского и английского языков. В 2009 году была добавлена ветка, которая позволяет распознавать смесь других языков. Программный продукт поставлялся со сканерами и МФУ от ведущих производителей: Hewlet-Pachard, Epson, Xerox и т.д. Последняя версия вышла в 2009 году. После скачивания и установки пробуем распознать текст. Для примера возьмем эту статью.



Разрешение

Чтобы вставить отсканированное изображение в документ Word 2010, выполните указанные ниже действия.

Использование программного обеспечения, включенного в сканер, для сканирования и сохранения образа на компьютере.

Запишите путь к сохраненному изображению.

Откройте Word 2010.

Нажмите кнопку Вставить, а затем выберите Рисунок.

В поле Вставка рисунка перейдите к папке, содержащей сохраненный образ.

Выберите изображение и нажмите кнопку Вставить.



Как отсканировать документ в Word

  • В первую очередь происходит сканирование документа. Для этого дела лучше выбирать формат png или jpg. Размер изображения также должен быть внушительным (от 400 dpi), чтобы при распознавании не было никаких проблем.
  • Полученные изображения сохраняются в конкретном месте, после чего потребуется сама программа для распознавания текста. Лучше всего сделать выбор в пользу Adobe FineReader. Это универсальное программное обеспечение, которое по качеству своей работы не вызывает никаких нареканий. Важно отметить, что после установки данной программы соответствующая вкладка должна появиться и в MS Word, соответственно, использование функционала существенно упрощается.
  • Через Adobe FineReader нужно выбрать пункт меню «Файл» и «Открыть», выбираем необходимые изображения. Далее появится меню обработки изображения, нам необходимо выбрать язык, который используется в документе, а также некоторые другие опции, среди которых словари и прочие настройки (не столь важные для получения результата).
  • Нажимаем кнопку «Распознать» и ждем, пока процесс завершится. Вполне вероятно, что распознается далеко не все, поэтому те слова, которые программа не смогла определить, будут выделены другим цветом, их можно редактировать прямо в программе.
  • Если текст в самом отсканированном документе немного смещен, то в Adobe FineReader необходимо выбрать те или иные абзацы текста при помощи выделения. Это позволит не пропустить текст при распознавании.
  • В итоге нужно нажать на кнопку «Сохранить», после чего появляется возможность выбрать место сохранения документа, а также его формат. Конечно же, в случае с MS Word нужно выбирать расширение doc или docx.
  • Если перед сохранением оказывается, что документ разбит на несколько колонок, то необходимо выбрать меню «Формат», далее перейти в «Колонки» и выбрать «Одна», чтобы документ смотрелся просто и гармонично. Также в «Параметрах страницы» присутствует возможность настройки полей, отступов и шрифтов.

Как сканировать через смартфон, используя Office Lens

  • Загрузить приложение «Office Lens» можно с Play Market или Apps Store (зависит от типа ОС на смартфоне). Установка ничем не отличается от инсталляции других программ.
  • После первого запуска на новом телефоне «Office Lens» делает запрос на разрешение доступа к файлам. Предоставьте его.
  • Теперь можно приступать к работе. Нажмите кнопку «Document» внизу окна.
  • Положите лист с текстом на стол и направьте на него камеру, чтобы тот полностью оказался в экране смартфона.
  • Сделайте фото кнопкой (круглая с красным ободком и белая внутри).
  • Утвердите согласие на сохранение кликом по галочке. Если нужно отсканировать еще страницы, то слева есть значок с «+».
  • Теперь переходим в меню приложения «Сохранить» на закладке «Экспорт в». В нем ищет и нажимаем значок «Ворд».
  • Далее будет предложено авторизоваться в сервисе OneDrive с логином и паролем учетной записи Microsoft.
  • Переходим на свой ПК или ноутбук. Открываем Ворд, а в нем нажимаем на пиктограмму «Открыть» в меню «Файл» или на главной панели инструментов.
  • Слева в списке ищем диск «OneDrive», а в нем наш файл. Выбираем его.
  • По необходимости можно внести правки.
  • Как отсканировать документ перед редактированием?

    Чтобы успешно манипулировать файлом в дальнейшем, важно правильно перевести его в формат “картинки”, а также учесть несколько простых, но полезных нюансов в самом процессе. Для этого:

    • Разгладьте все заломы и складки, чтобы они не отобразились на скане и не привели к трудностям в распознавании букв.
    • Для удобства обращения сохраните файл в формате PDF, JPG или TIFF.
    • PDF-документ можно будет открыть и редактировать программой Adobe Acrobat (или любой другой, предназначенной для подобных целей).
    • Зайдите на сайт компании-создателя сканера, либо поищите фирменную программу на прилагавшемся диске (часто известные бренды имеют собственные приложения для изменения отсканированных страниц).
    • Для последующего использования файла в MS Office 2003 или 2007, установите утилиту Microsoft Office Document Scanning. Она производит конвертацию сканируемого файла автоматически, переводя его сразу в текст (программа не работает с более “свежими” версиями Офиса).
    • Рекомендуется сканировать в черно-белой гамме, а не в цветной – это упрощает анализ текста.
    • TIFF формат лучше всего применять для OCR конвертеров, то есть программ, производящих оптическое распознавание.

    Как это работает

    Оптическое распознавание текста (OCR — Optical Character Recognition) – это возможность преобразовать текст из графического вида (фото, скан, pdf) в обычный формат. Преобразованный текст можно редактировать. Любая растровая картинка состоит из точек. Программное обеспечение для распознавания выделяет на картинке буквы и переводит их в текст. Происходит анализ структуры документа. Выделяются текстовые блоки. Затем строятся линии, которые делятся на слова, а далее на символы. Каждый символ сравнивается с шаблонами. После чего строятся гипотезы, что это за символ. Исходя их них, ПО анализирует разные варианты разбиения строк на слова, а слова на символы. Количество таких гипотез огромно. В конец концов программа принимает решение и выдает текст.

    Как отредактировать отсканированный документ – работа с OCR-утилитами

    Принцип метода Optical Character Recognition — считывание имеющихся на бумаге символов, их последующее сравнение с элементами из собственной базы данных. Таким образом происходит преобразование сплошной картинки в редактируемый текст. Яркие примеры программ, справляющихся с данной задачей – Adobe Acrobat и Evernote. Чтобы внести исправления в имеющийся скан, просто откройте его одним из таких приложений, весь последующий процесс произойдет автоматически. Когда программа закончит распознавание, то предложит пользователю сохранить документ в одном из доступных форматов.

    Для запуска процесса:

    Данная программа автоматом выделит фрагменты документа, рисунки и таблицы, при необходимости повернет сканированный текст по нужному направлению. После завершения сканирования, в данной программе требуется выбрать язык для расшифровки написанного.Выбрать его можно в выпадающем окне «Язык документа», если загруженный скан будет написан на нескольких иностранных языках – следует выбрать автоматический режим.

    Решение задачи с помощью OCR

    Если вам нужно редактирование отсканированных документов, то воспользуйтесь любой программой OCR, функция которой заключается в оптическом распознавании символов. Данное ПО сравнивает символы в отсканированном файле с теми символами, которые имеются в его БД. После этого, программа данной категории производит конвертацию файла в удобный текстовый формат

    Однако примите во внимание, что далеко не все OCR способны работать на бесплатной основе – среди них есть немало и платных вариантов. Также учтите, что в зависимости от того, насколько качественно вам удастся выполнить сканирование оригинала, вы можете столкнуться с различными ошибками, редактируя готовый скан

    Чтобы решить непосредственно задачу связанную с тем, как редактировать сканированный текст следуйте следующей инструкции:

    • Загрузите программу OCR с официального сайта разработчика или любого надежного веб-ресурса и установите ее.
    • Откройте редактируемый файл в окне программы. Данный процесс может отличаться для каждого ПО подобного типа, но в целом от вас потребуется открыть файл, после чего запустить процесс конвертации. Во многих таких программах можно выбирать подходящий формат выходного файла. Главное, чтобы измененный тип документ был удобен для вас.
    • После произведенной конвертации вам нужно будет удалить из готового файла форматирование, если с ним возникли какие-то проблемы. Дело в том, что ПО может учесть форматирование, к примеру, шрифты, межстрочные интервалы, если сканируемый файл отсканируется недостаточно ровно. Чтобы удалить форматирование используйте любой текстовый редактор, к примеру, обычный «Блокнот». Он, как правило, не способен распознавать форматирование, благодаря чему вставить текст в него можно без лишнего кода.
    • В конце вам нужно открыть новый документ в любом удобном редакторе и приступить к такому процессу, как редактирование сканированных документов. Обязательно воспользуйтесь функцией проверки орфографии, чтобы вовремя найти все ошибки и устранить их. Но ошибки, связанные с форматированием, придется исправлять ручным образом.

    Но прежде чем включить сканер и отсканировать тот или иной текст, вам стоит изначально определиться с удобной для вас программой оптического распознавания символов. Далее можно ознакомиться с одними из самых популярных и распространенных среди них:

  • Одной из самых известных программ категории OCR, является ABBYY FineReader, работающая на платной основе. Данное ПО используется для конвертирования сканов в текстовые файлы с помощью запатентованных алгоритмов, которые позволяют распознавать даже текст, имеющий не очень высокое качество. В целом преимущества программы заключаются в высокой точности распознавания текста, способности преобразовывать всю структуру и внешний вид отсканированного текста. Следовательно, она оставит на своих местах не только текст, но также таблицы, рисунки и прочее.
  • Readiris Pro — также является довольно распространенной программой с функцией OCR, которая обладает очень удобным интерфейсом. С ее помощью можно сохранить распознанный текст в таких форматах, как XPS, OpenOffice, PDF, Word и Excel. Следует добавить, что эта программа позволяет работать с более чем сотней языков мира и форматом DjVu.
  • Freemore OCR представляет собой программу, распространяемую абсолютно бесплатно. С ее помощью можно достаточно оперативно извлекать графику и текст с отсканированных изображений. Извлеченный текст можно сохранить в виде документа Word. Помимо этого, она обладает функцией многостраничного распознавания. Но учтите, что интерфейс программы выполнен только на английском языке. Однако данное обстоятельство не влияет на удобство ее использования.
  • Тоже будет интересно