Как устранить проблемы с кодировкой при отображении pdf?

Часто приходят файлы pdf (особенно сформированные автоматически — счета, списки и т.п.), при открытии которых наблюдаются явные проблемы с кодировкой, например, такие:
Проблемы с кодировкой pdf
Для того, чтобы устранить такую проблему с отображением кодировки, сначала нужно посмотреть, что за шрифты используются в документе. Для этого выбираем Properties (Свойства) в меню File (Файл) и переходим на вкладку Fonts (Шрифты). Видим примерно следующую картину:

Проблемы с кодировкой pdf

Мы видим, что в документе используется шрифт Arial, который не встроен в документ (что уже плохо), а кроме того — его кодировка не определена. Для решения проблемы со шрифтами от Microsoft нужно установить пакет ttf-mscorefonts-installer:

sudo apt-get install ttf-mscorefonts-installer

Однако, при установке пакета может возникнуть две проблемы — во-первых, это лицензионное соглашение, чтобы принять которое, нужно нажать сначала кнопку Tab, а затем Enter, когда курсор перейдёт к кнопке Ok.

Вторая проблема при установке пакета — ошибка загрузки шрифтов, которая выглядит примерно так:

E: Failed to fetch http://downloads.sourceforge.net/corefonts/andale32.exe Hash Sum mismatch

E: Download Failed

При этом пакет выглядит, как установленный, но фактически шрифтов в системе нет. Для того, чтобы обойти эту ошибку, можно скачать новый пакет ttf-mscorefonts-installer_3.6_all.deb из репозитория Debian и установить его с помощью диспетчера приложений. Всё, теперь файлы pdf будут открываться в правильной кодировке!

Добавить комментарий

Ваш адрес email не будет опубликован.

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.