IT24

Как конвертировать документ Word в HTML-формат

Microsoft Word — один из самых удобных и распространенных текстовых редакторов. Статья, написанная на одном компьютере, будет без проблем открыта на любом другом ПК, где установлен Microsoft Office.

К сожалению, такая совместимость поддерживается только для внутренних вордовских форматов: DOC и DOCX.

Если содержимое файла сохранить в HTML,

Как конвертировать документ Word в HTML-формат. Сохранение файла в Microsoft Word

и вставить полученный код на сайт или блог, то текст из Ворда будет сильно отличаться от стандартного текста, а иногда быть может просто не читаем.

Почему?

Дело в том, что при конвертации DOCX файла в HTML, Ворд прописывает свои CSS-стили, которые отличаются от стилей сайта или блога.

Для примера скачаем первый попавшийся DOCX файл и сохраним его в HTML (см. ниже).

Как конвертировать документ Word в HTML-формат. DOCX файл

Теперь, откроем и посмотрим его в браузере.

DOCX файл, сконвертированный в HTML

На первый взгляд все корректно:

— выравнивание текста по центру и вправо,

— выделение жирным шрифтом — все как и в оригинале.

Посмотрим теперь код HTML-файла.

HTML-файл, сконвертированный Вордом

Видим — класс MsoNormal и много дополнительных стилей, прописанных в каждой строке. Вряд ли все эти стили будут совместимы с родными стилями сайта.

К тому же, даже на такой минимальный по оформлению и объему файл, Ворд нагенирировал 45 Kb кода, хотя в нем текста максимум на 1 kb.

В общем вывод простой — использовать сам Word для конвертации текста в HTML формат не целесообразно и лучше поискать другие приложения.

Небольшие и средние DOCX-файлы лучше всего конвертировать с помощью многочисленных онлайн утилит.

Последнее изменение: