Как изменить кодировку в Word
Обновлено: 20.11.2024
Я не очень хорошо знаком с кодировкой, которую использует Microsoft Word. Если кто-то, где сохранить файл .doc или .docx из Word, какая стандартная кодировка используется?
Я предполагаю, что это не UTF-8, так как результирующий текст (вставленный в текстовый файл с кодировкой UTF-8) не учитывает некоторые знаки препинания (например, кавычки).
Например, открывающая "умная кавычка" Word при вставке в текстовый файл UTF-8 приводит к появлению символа ì. Если Word действительно кодирует в UTF-8, то как Word пытается отобразить фактический символ UTF-8?
Изменить
Покопавшись немного, я обнаружил, что файл Microsoft Word .docx на самом деле представляет собой сжатый формат. В результате распаковки будет распакован ряд XML-файлов.
Однако неспособность текстового файла с кодировкой UTF-8 учитывать эти «умные» кавычки по-прежнему вызывает недоумение. Любая просветительская информация будет полезна.
Я не могу воспроизвести такое поведение. Может проблема в текстовом редакторе? Вы можете проверить с помощью шестнадцатеричного редактора, такого как HxD, и посмотреть, что на самом деле записывается в текстовый файл. «ЛЕВАЯ ДВОЙНАЯ КАВАТА» (U+201C) должна быть закодирована с использованием следующих трех байтов: E2 80 9C
Я не знаю, какой текстовый редактор вы используете для редактирования этого XML-файла. И моя лучшая ставка прямо сейчас, будет то, что это делает плохую работу. Вы используете Блокнот++? Если нет, я бы скачал и установил Notepad++. Это очень прозрачно в использовании кодировок.
Насколько мне известно, notepad++ — это простой текстовый редактор, в котором нет возможностей для чтения двоичных файлов, таких как файлы pdf или docx. Это все равно, что попросить своего англоговорящего друга мистера Блокнота проиндексировать или перевести русский текст. Это вообще другой алфавит/язык (другая кодировка символов)
1 Ответ 1
В наши дни файл docx представляет собой набор сжатых файлов xml. Одним из таких файлов является файл document.xml, который начинается со следующей строки (т. е. пролога xml):
Как видите, это кодировка UTF-8.
UTF-8 поддерживает весь набор символов Unicode. Для полноты изложения это не означает, что все символы UTF-8 могут использоваться в xml-файле. Даже блок CDATA имеет свои ограничения. Но, несмотря на все это, хранение ` или ì не проблема.
И, что более важно, формат файла не имеет ничего общего с поведением копирования и вставки самого приложения.
Тем не менее, вот как слово хранит символы ` и ì.
Немного сбивает с толку, но я только что понял, что под "умными кавычками" вы, вероятно, подразумеваете механизм, с помощью которого Word представляет фигурные кавычки. В моем предыдущем ответе я думал, что вы имели в виду «обратные кавычки», а это другое. - Извините за путаницу.
В любом случае, вот юникоды для этих умных кавычек:
Давайте поместим их в простой текстовый файл в кодировке UTF-8. Результат не такой впечатляющий:
- U+2018 закодирован в UTF-8 как E2 80 98
- U+2019 закодирован в UTF-8 как E2 80 99
- U+201C кодируется в UTF-8 как E2 80 9C.
- U+201D кодируется в UTF-8 как E2 80 9D.
Итак, я пошел еще дальше и поместил их в файл Word. Я ввел строку с обычными кавычками и одну со смарт-кавычками.
Затем я сохранил это и посмотрел, как оно хранится в XML-структуре Word. И на самом деле он хранится точно так, как ожидалось.
Консорциум Unicode присваивает уникальный код каждому символу, который вы можете набирать с клавиатуры. Это кодовая точка в шестнадцатеричном формате, например U+2714 для символа галочки ✔. Однако отдельные приложения используют кодировку символов для преобразования этой кодовой точки Unicode в двоичный компьютерный код. Когда вы вводите код, ваш компьютер преобразует его в символ, используя кодовую страницу локали. Таким образом, кодировка символов документов важна для просмотра в читаемом формате.
Просматриваете ли вы ненужные символы в Word?
Microsoft Word использует стандартную кодировку символов Windows или macOS для расширений файлов, таких как .doc и .docx. Вы увидите ненужные символы при открытии простого текстового файла с другой кодировкой символов. Это не означает, что документ поврежден. Это означает, что документ был сохранен с другим стандартом кодировки, и вам нужно изменить кодировку для просмотра в Word.
Как изменить кодировку символов в Microsoft Word?
Каждый раз, когда вы открываете несовместимый документ, Word показывает диалоговое окно преобразования файла. Однако, если вы его не видите, эту опцию легко включить.Вы можете открыть любой документ Word, чтобы включить этот параметр, так как он будет применяться ко всем документам.
Включить диалоговое окно преобразования формата файла
- Откройте документ и перейдите в меню «Файл > Параметры».
- Нажмите на раздел "Дополнительно" и прокрутите вниз до раздела "Общие" на правой панели.
- По умолчанию Word отключает параметр "Подтверждать преобразование формата файла при открытии".
- Установите флажок, чтобы включить этот параметр.
- Нажмите "ОК", чтобы применить изменения и закрыть все открытые документы.
Этот параметр поможет вам вызывать диалоговое окно всякий раз, когда вы открываете файлы форматов, отличных от .doc или .docx. Например, если вы используете Word для открытия простого текстового файла с расширением .txt, вы получите запрос на проверку формата файла.
Изменить кодировку символов
Теперь откройте файл, кодировку которого вы хотите изменить. Word покажет вам диалоговое окно «Преобразовать файл», как показано ниже.
Выберите формат файла, если вы знаете, как обычный текст или HTML-документ. Если вы не уверены, выберите опцию «Кодированный текст» и нажмите кнопку «ОК». Далее вы увидите диалоговое окно «Преобразование файла». Как правило, «Windows (по умолчанию)» выбирает кодировку на основе ваших региональных настроек. Это может создать проблемы при просмотре специальных символов и символов.
Выберите параметр «Другая кодировка», чтобы активировать поле со списком рядом. Вы увидите список вариантов кодировки, доступных в списке, и выберите формат «Юникод (UTF-8)». При необходимости выберите вставку разрывов строк и разрешите параметры замены символов. Нажмите «ОК», чтобы завершить процесс. Теперь вы успешно изменили кодировку символов файла на UTF-8.
Это поможет вам просмотреть содержимое файла в читаемом формате, поскольку UTF-8 должен поддерживать большинство символов.
Отключить преобразование файлов
После того как вы закончите изменение кодировки файла, обязательно отключите параметр преобразования файла. Вернитесь в «Файл > Параметры» и измените настройки в разделе «Дополнительно». Это поможет вам отключить диалоговое окно преобразования файлов в будущем.
Сохранение файлов в другой кодировке
Вы не можете изменить кодировку файла, который вы сохраняете как файл .docx. Word назначит кодировку символов по умолчанию в зависимости от вашего регионального языка или UTF-8. Однако вы можете изменить кодировку, преобразовав файл в обычный текстовый формат.
- Перейдите в меню "Файл" и выберите "Сохранить как".
- Нажмите раскрывающееся меню "Тип файла" и выберите вариант "Обычный текст".
Нажмите кнопку «Сохранить», и Word откроет диалоговое окно «Преобразование файлов», как описано выше. Оттуда вы можете изменить кодировку и сохранить документ.
Изменить кодировку в Word Office 365 на Mac
Как и в Windows, в версии Office 365 для Mac также есть параметры, позволяющие включить проверку формата файла и предложить преобразование.
- Откройте документ Microsoft Word и перейдите в раздел «Word > Настройки…».
- Нажмите «Общие» в разделе «Инструменты для редактирования и проверки».
- Включите параметр «Подтверждать преобразование формата файла при открытии» в разделе «Настройки».
- Закройте все открытые документы, чтобы изменения вступили в силу.
Каждый раз, когда вы открываете несовместимый файл, Word показывает диалоговое окно параметров преобразования файла.
Выберите «Кодированный текст» или формат файла, если он вам известен, и нажмите кнопку «ОК». В следующем диалоговом окне вы можете выбрать опцию «Другая кодировка» и выбрать кодировку «Юникод (UTF-8)».
В отличие от Windows, здесь вы можете четко увидеть предупреждающее сообщение, указывающее на выбор кодировки, которая сделает ваш документ читабельным. Кроме того, вы можете обнаружить, что несовместимый текст помечен красным с сообщением о том, что этот текст не будет правильно сохранен с выбранной кодировкой.
Кроме того, вы также можете сохранить файл в текстовом формате, чтобы изменить кодировку на Mac так же, как в версии для Windows Word.
Стандарты кодирования позволяют пользователям компьютеров читать документы независимо от языка, на котором они говорят, или используемой компьютерной системы. Например, если вы создаете документ Word 2007 с использованием английского стандарта кодирования, люди, читающие по-гречески, могут не прочитать его, если только их программы Word не отображают символы документа с использованием соответствующего стандарта кодирования. Если вы создаете документы Word 2007 для совместного использования, вы можете выбрать стандарт кодирования перед их сохранением. У вас также есть возможность выбрать стандарт кодирования при открытии полученного документа.
Установить кодировку при открытии файла
Шаг 1
Запустите Word 2007 и коснитесь или щелкните кнопку "Офис", затем коснитесь или щелкните "Параметры Word".
Шаг 2
Нажмите или нажмите «Дополнительно» и установите флажок «Подтверждать преобразование формата файла при открытии» в разделе «Общие».
Шаг 3
Нажмите или нажмите "ОК", закройте документ и снова откройте его. Коснитесь или щелкните «Кодированный текст», а затем коснитесь или щелкните «Другая кодировка», чтобы просмотреть список стандартов кодирования. Предварительный просмотр документа отображается под списком на панели предварительного просмотра.
Шаг 4
Нажмите или выберите стандарт кодирования, который вы хотите использовать. Когда вы это сделаете, панель «Предварительный просмотр» покажет, как выглядит документ с использованием выбранного вами стандарта кодирования. Нажмите "ОК", чтобы применить изменения.
Установить кодировку при сохранении файла
Шаг 1
Нажмите или нажмите кнопку "Офис", а затем нажмите или нажмите "Сохранить как".
Шаг 2
Введите имя файла в текстовое поле «Имя файла», а затем коснитесь или щелкните раскрывающееся меню «Тип файла».
Шаг 3
Нажмите или щелкните "Обычный текст", затем коснитесь или щелкните "Сохранить", чтобы сохранить изменения. Нажмите «Продолжить», чтобы закрыть диалоговое окно «Проверка совместимости Microsoft Office Word», если оно открывается. Word открывает диалоговое окно «Преобразование файлов», в котором отображается список стандартов кодирования.
Шаг 4
Перейдите к списку и коснитесь или щелкните "Windows (по умолчанию)", если вы хотите использовать стандарт кодирования по умолчанию. Коснитесь или щелкните «MS-DOS», если вы предпочитаете использовать стандарт кодирования MS-DOS. Чтобы выбрать другой стандарт кодирования, коснитесь или щелкните «Другая кодировка», а затем коснитесь или щелкните тот, который вы хотите использовать. После того, как вы выберете стандарт кодирования, на панели «Просмотр» будет показан предварительный просмотр того, как ваш документ будет выглядеть с использованием этого стандарта.
Шаг 5
Нажмите "ОК", чтобы применить изменения.
- При выборе стандарта кодировки может появиться следующее сообщение: "Текст, выделенный красным, не будет корректно сохранен в выбранной кодировке". Установите флажок "Разрешить замену символов", чтобы Word заменял символы, которые не могут отображаться, на наиболее подходящие эквивалентные символы.
- Если вы поставите галочку рядом с «Подтверждать преобразование формата файла при открытии», вы увидите диалоговое окно при открытии документа Word 2007, который не имеет стандартного формата Word, такого как DOC. Microsoft рекомендует снять этот флажок, если вам не нужно открывать документы, требующие выбора стандарта кодирования. Это сэкономит время, поскольку вам не придется так часто закрывать диалоговое окно.
- При сохранении документа Word после выбора стандарта кодирования у вас есть возможность установить флажок рядом с «Вставить разрывы строк». Установите этот флажок, если программа, открывающая документ, не поддерживает перенос строк.
После изучения физики Кевин Ли начал профессионально писать в 1989 году, когда, будучи разработчиком программного обеспечения, он также писал технические статьи для Космического центра Джонсона. Сегодня этот городской техасский ковбой продолжает выпускать высококачественное программное обеспечение, а также нетехнические статьи на самые разные темы, от игр до текущих событий.
MS Word является наиболее широко используемым программным обеспечением в мире благодаря упрощенным функциям и простоте использования. Это самое известное программное обеспечение для обработки текстов, включая написание текстов, форматирование текстовых документов, вставку специальных функций и многое другое.
Каждое программное обеспечение или приложение имеет свои уникальные функции, и даже если одна функция или бит не совпадают, в компьютерной системе неизбежно возникает какая-то непредвиденная проблема или сообщение. Много раз владельцы ПК сталкиваются с такими проблемами, которые известны как ошибки кодирования, при которых стандарты кодирования MS Word становятся несоответствующими из-за некоторых внутренних или внешних причин.Всякий раз, когда в системе кодирования Repairit по умолчанию возникает несоответствие, инструмент обработки текстов будет отображать сообщение об ошибке. Различными причинами ошибок кодирования в Repairit могут быть:
Возможная вирусная атака или наличие ошибок или вредоносного ПО в компьютерной системе могут снизить производительность файловых документов MS Word.
Неправильное обращение с оборудованием или программным обеспечением приводит к проблемам с кодировкой.
Использование ненадежных и небезопасных онлайн-источников, которые могут повлиять на нормальное функционирование системы.
Какова бы ни была причина ошибок кодирования в инструменте MS Word, пользователям потребуется исправить ошибки кодирования файлов Word с помощью эффективного и надежного инструмента восстановления файлов Word для восстановления поврежденных или поврежденных файлов Word.< /p>
Часть 1. Загрузите бесплатно лучший инструмент для восстановления Word
Возможны ситуации, когда при открытии программы Microsoft Word в окне отображаются странные символы, которые невозможно понять. Вместо того, чтобы показывать сохраненный документ Word, пользователям приходится иметь дело с закодированными символами.
Но вам не о чем беспокоиться, так как вы можете восстанавливать и восстанавливать поврежденные или поврежденные файлы Word, а также исправлять ошибки кодировки файлов Word с помощью Wondershare Repairit - File Repair или программного обеспечения, которое является эффективным инструментом восстановления файлов Word для решения всех ваших проблем. в одно мгновение. Вот некоторые из поразительных особенностей этого инструмента для восстановления текстовых файлов:
Возможности Wondershare Repairit
После того, как вы выбрали и в конечном итоге восстановили документ, вы можете просмотреть его в различных режимах.
Функция пакетной обработки позволяет одновременно восстанавливать файлы разных форматов.
Восстанавливает поврежденные файлы MS Word, созданные в MS Word 2013, 2010, 2007, 2003, 2002 и 2000
Приложение также отображает сведения о ходе восстановления, сканирования или ожидания восстановления файла
Поэтому, если вы манипулировали ошибками в Repairit, вы можете значительно исправить ошибки кодирования файлов Word с помощью Wondershare Repairit - File Repair.
Часть 2. Как исправить ошибку кодировки файла MS Word
Некоторые из шагов, которые необходимо выполнить, чтобы добиться того же, включают:
Шаг 1. Загрузите и запустите
Загрузите и установите Wondershare Repairit на свой компьютер. Теперь запустите его, и на панели инструментов вы можете выбрать файлы из точного местоположения или диска, на котором вы сохранили определенный файл слова, нажав «Добавить».
Шаг 2. Начните ремонт
Теперь на экране компьютера появится список файлов слов. Вы можете выбрать конкретные файлы, которые вы хотите восстановить. Теперь вы можете нажать «Восстановить».
Шаг 3. Предварительный просмотр и сохранение
После завершения процесса восстановления вы можете просмотреть восстановленные файлы на экране.
Чтобы сохранить конкретный восстановленный файл (файлы), вам необходимо указать указанный путь и папку, в которой вы хотите их сохранить. Нажмите "ОК".
Теперь вы восстановили поврежденные файлы Word с помощью эффективного инструмента восстановления файлов Word.
Если вы сталкивались с ошибками кодировки файлов Word, вы можете исправить ошибки кодировки файлов Word с помощью Wondershare Repairit - File Repair. Кроме того, чтобы избежать подобных ошибок в будущем, пользователи могут сохранять бдительность, предотвращая ошибки кодирования файлов Word. Вот несколько эффективных советов по предотвращению этого:
Всегда сохраняйте резервную копию важных файлов Word. Поступая таким образом, они могут гарантировать, что всякий раз, когда возникает какая-либо ошибка, такая как ошибка кодировки файла слова, их важные данные и файлы находятся в безопасности в другом месте.
Сохраняйте файлы Word или текстовые документы в форматах файлов MS Word, таких как DOCX. Это гарантирует отсутствие ошибок кодирования и сохранность важных файлов пользователей.
Закройте или завершите работу системы или файла MS Word только после правильного сохранения их текстовых файлов, чтобы избежать потери данных из-за ошибок кодирования.
Установлено надежное антивирусное программное обеспечение для защиты файлов MS Word от любых потенциальных ошибок.
Читайте также:
- Как удалить диапазон ячеек в Excel
- Хранит программное обеспечение, которое запускается сразу после включения питания и обычно содержит биос
- Программное обеспечение для отключения звука микрофона в Windows 10
- Программное обеспечение Scanmatic 2 для Android
- Фотошоп аварийно завершает работу при сохранении