OCR PDF в редактируемый Word — пошаговый путь
Сканированный PDF — это набор картинок (image-only PDF), и обычное «открыть в Word» не даст редактируемый текст: вы увидите страницы как изображения. Чтобы получить редактируемый Word, нужен OCR (Optical Character Recognition) — распознавание текста на картинке. В 2025 году у вас три рабочих пути. Первый — встроенный Word (с версии 2019): File → Open → выбираете .pdf. Word предупредит, что распознавание может занять время, и попытается выделить текст. Работает для документов с одним шрифтом, простой вёрсткой, разрешением сканера 300 dpi+. Не работает для сканов с пятнами, рукописных пометок, многоколоночной вёрстки. Второй путь — ABBYY FineReader 16 (платно, ~3 000 ₽/мес для бизнеса) — лучший OCR для русского, точность 98%+ даже на не очень чистых сканах, экспорт в .docx с сохранением вёрстки, таблиц, шрифтов. Третий — Adobe Acrobat Pro DC: Tools → Recognize Text → In This File. По русскому хуже ABBYY, но если у вас уже Adobe — нормальный вариант. Обходные пути с онлайн-сервисами (smallpdf, ilovepdf, sodapdf) подходят только для несекретных документов — данные уходят на чужие серверы. SideGenius за 5 секунд показывает, какой PDF у вас (image-only требует OCR / уже текстовый просто конвертируется), и направляет к нужному инструменту: для текстового — конвертирует напрямую через PDF.js + Word.Body.insertText без потери вёрстки.
Анализ договор-ООО.pdf (12 стр, 18 МБ, разрешение 297 dpi): image-only PDF, OCR требуется. Рекомендация — ABBYY FineReader, режим «Документ Word» с сохранением вёрстки. Ожидаемая точность по русскому 98%, время распознавания ~3 минут на 12 страниц. Альтернатива — Word 2019 встроенный OCR (точность 90–93%, бесплатно, потребует ручной правки таблиц).
Почему не ChatGPT
ChatGPT не открывает PDF и не запускает OCR. Может объяснить общую теорию. SideGenius через Office.js и PDF.js определяет тип PDF, оценивает качество скана и подсказывает оптимальный инструмент. Сам распознавание пока не делает — направляет к ABBYY/Acrobat/встроенному Word. Без VPN, оплата картами РФ.
Как использовать за 3 шага
Зарегистрируйтесь на sidegenius.ru — мастер онбординга подключит SideGenius к Word за 2 минуты.
Загрузите PDF — SideGenius определит, image-only это или текстовый, и подскажет инструмент.
Подтвердите — для текстового PDF SideGenius сделает конверсию сам; для скана направит к ABBYY/встроенному OCR Word.
Вопросы и ответы
Word 2016 умеет открывать PDF — это OCR?
Word 2013/2016 умеет открывать только текстовые PDF, image-only показывает как картинки. OCR в Word появился в версии 2019. Если у вас 2016 и скан — нужен ABBYY, Acrobat, или онлайн-сервис. Альтернатива — Microsoft Lens (бесплатное мобильное приложение), сфотографировал документ — получил docx.
Какое разрешение сканера для хорошего OCR?
Минимум 300 dpi для печатного текста на белой бумаге. 200 dpi — пограничное, точность 85–90%. 600 dpi — для документов с мелким шрифтом или старых документов. Цветной режим обычно не нужен — серый или ч/б достаточно и в 2× меньше по объёму. Для рукописного — 600 dpi и платный OCR (FineReader Pro).
Как сохранить таблицы при OCR?
Это самая сложная задача OCR. Word 2019 встроенный OCR теряет структуру таблиц — текст распознаёт, но в один абзац. ABBYY FineReader сохраняет таблицы лучше (точность 90%+), Adobe Acrobat — средне. Для сложных таблиц с объединёнными ячейками — экспортируйте в Excel и потом вставляйте в Word.
Безопасны ли онлайн-OCR сервисы (smallpdf, ilovepdf)?
Для несекретных документов — да, скорее всего. Для договоров с реквизитами, паспортов, медицинских документов — НЕТ, не используйте. Файлы хранятся на серверах сервиса 1–24 часа после обработки, бесплатные сервисы могут передавать в обучение AI-моделей. Используйте локальный OCR (Word 2019, ABBYY).
Что делать с рукописным текстом?
Стандартный OCR (Word, FineReader) на рукописи работает плохо — точность 50–70%. Лучшее решение — Microsoft OneNote с пером (распознаёт по мере написания), или специализированные сервисы вроде Google Document AI. Для оцифровки старых рукописных архивов — обычно дешевле перепечатать руками, чем чистить OCR-результат.
Сколько это стоит?
Бесплатный старт — 20 кредитов на пробу. Подписка Pro — 399 ₽/мес, оплата картами банков РФ через ЮKassa, без VPN. ABBYY FineReader покупается отдельно у вендора.
Попробуйте SideGenius бесплатно
20 кредитов на старт, без карты. Работает в Word для Windows, Mac и Online. Оплата картами РФ.
Установить в Word