Как сохранить файл в кодировке utf 8

Обновлено: 03.07.2024

Как правило, вы можете обмениваться текстовыми файлами, не беспокоясь о том, как хранится текст. Однако если вы делитесь текстовыми файлами с людьми, которые работают на других языках, загружаете текстовые файлы через Интернет или делитесь текстовыми файлами с другими компьютерными системами, вам может потребоваться выбрать стандарт кодирования при открытии или сохранении файла.

Когда вы или кто-то другой открывает текстовый файл в Microsoft Word или в другой программе — возможно, на компьютере с системным программным обеспечением на языке, отличном от языка, который использовался для создания файла — стандарт кодирования помогает в этом. программа определяет, как представить текст, чтобы он был удобочитаемым.

Что вы хотите сделать?

Знакомство с кодировкой текста

То, что кажется вам текстом на экране, на самом деле сохраняется в виде числовых значений в текстовом файле. Ваш компьютер переводит числовые значения в видимые символы. Это достигается с помощью стандарта кодирования.

Стандарт кодирования — это схема нумерации, при которой каждому текстовому символу в наборе символов присваивается числовое значение. Набор символов может включать буквы алфавита, цифры и другие символы. Разные языки обычно состоят из разных наборов символов, поэтому существует множество различных стандартов кодирования для представления наборов символов, используемых в разных языках.

Разные стандарты кодирования для разных алфавитов

Стандарт кодирования, сохраненный в текстовом файле, предоставляет информацию, необходимую вашему компьютеру для отображения текста на экране. Например, в кодировке кириллицы (Windows) символ Й имеет числовое значение 201. Когда вы открываете файл, содержащий этот символ, на компьютере, использующем кодировку кириллицы (Windows), компьютер считывает числовое значение 201 и отображает Й на экране.

Однако, если вы откроете тот же файл на компьютере, использующем другую кодировку, компьютер отобразит любой символ, соответствующий числовому значению 201 в стандарте кодировки, который компьютер использует по умолчанию. Например, если на вашем компьютере используется западноевропейский (Windows) стандарт кодировки, символ в исходном кириллическом файле будет отображаться как É, а не Й, поскольку в западноевропейской (Windows) кодировке значение 201 отображается на É.< /p>

Юникод: единый стандарт кодирования для многих алфавитов

Чтобы избежать проблем с кодированием и декодированием текстовых файлов, вы можете сохранять файлы в кодировке Unicode. Юникод поддерживает большинство наборов символов для всех языков, которые сегодня широко используются пользователями компьютеров.

Поскольку Word основан на Unicode, Word автоматически сохраняет файлы, закодированные как Unicode. Вы можете открывать и читать файлы в кодировке Unicode на своем англоязычном компьютере независимо от языка текста. Аналогичным образом, когда вы используете англоязычную систему для сохранения файлов в кодировке Unicode, файл может содержать символы, не встречающиеся в западноевропейских алфавитах, например символы греческого, кириллического, арабского или японского языков.

Выберите стандарт кодирования при открытии файла

Если при открытии файла текст отображается искаженным, в виде вопросительных знаков или прямоугольников, возможно, Word не точно определил стандарт кодирования текста в файле. Вы можете указать стандарт кодирования, который можно использовать для отображения (декодирования) текста.

Перейдите на вкладку "Файл".

Нажмите "Параметры".

Нажмите "Дополнительно".

Прокрутите до раздела "Общие" и установите флажок "Подтверждать преобразование формата файла при открытии".

Примечание. Если этот флажок установлен, Word отображает диалоговое окно «Преобразовать файл» каждый раз, когда вы открываете файл в формате, отличном от формата Word (форматы Word включают .doc, .dot, .docx, .docm, . файлы dotx или .dotm). Если вы часто работаете с такими файлами, но редко хотите выбирать стандарт кодирования, не забудьте отключить этот параметр, чтобы это диалоговое окно не открывалось без необходимости.

Закройте и снова откройте файл.

В диалоговом окне "Преобразовать файл" выберите "Закодированный текст".

В диалоговом окне "Преобразование файла" выберите "Другая кодировка", а затем выберите нужный стандарт кодировки из списка.

Вы можете предварительно просмотреть текст в области предварительного просмотра, чтобы проверить, читается ли весь текст в выбранном стандарте кодирования.

Если почти весь текст выглядит одинаково (например, все прямоугольники или все точки), возможно, не установлен шрифт, необходимый для отображения символов. Если нужный вам шрифт недоступен, вы можете установить дополнительные шрифты.

Чтобы установить дополнительные шрифты, выполните следующие действия:

В Microsoft Windows нажмите кнопку "Пуск" и выберите "Панель управления".

Выполните одно из следующих действий:

В Windows 7

На панели управления нажмите "Удалить программу".

В списке программ щелкните список для Microsoft Office или Microsoft Word, в зависимости от того, установили ли вы Word как часть Office или как отдельную программу, а затем нажмите Изменить.

В Windows Vista

На панели управления нажмите "Удалить программу".

В списке программ щелкните список для Microsoft Office или Microsoft Word, в зависимости от того, установили ли вы Word как часть Office или как отдельную программу, а затем нажмите Изменить.

В Microsoft Windows XP

На панели управления нажмите "Установка и удаление программ".

В поле Установленные программы щелкните список Microsoft Office или Microsoft Word, в зависимости от того, установили ли вы Word как часть Office или как отдельную программу, а затем нажмите Изменить.

В разделе "Изменить установку Microsoft Office" нажмите "Добавить или удалить компоненты", а затем нажмите "Продолжить".

В разделе «Параметры установки» разверните «Общие функции Office», а затем разверните «Международная поддержка».

Выберите нужный набор шрифтов, нажмите стрелку рядом с выбором и выберите «Запустить с моего компьютера».

Совет. Когда вы открываете закодированный текстовый файл, Word применяет шрифты, указанные в диалоговом окне "Параметры веб-сайта". (Чтобы открыть диалоговое окно «Параметры веб-страницы», нажмите кнопку Microsoft Office, щелкните «Параметры Word», а затем нажмите «Дополнительно». В разделе «Общие» нажмите «Параметры веб-сайта».) Вы можете выбрать параметры на вкладке «Шрифты» в диалоговом окне «Параметры веб-сайта», чтобы настроить шрифт для каждого набора символов.

Выберите стандарт кодирования при сохранении файла

Если вы не выберете стандарт кодировки при сохранении файла, Word кодирует файл как Unicode. Обычно можно использовать кодировку Unicode по умолчанию, поскольку она поддерживает большинство символов большинства языков.

Если ваш документ будет открыт в программе, не поддерживающей Unicode, вы можете выбрать стандарт кодирования, соответствующий стандарту целевой программы. Например, Unicode позволяет создать документ на традиционном китайском языке в англоязычной системе. Однако, если документ будет открыт в программе на традиционном китайском языке, которая не поддерживает Unicode, вы можете сохранить документ в традиционной китайской кодировке (Big5). Когда документ открывается в программе на традиционном китайском языке, весь текст отображается правильно.

Примечание. Поскольку Unicode является наиболее полным стандартом, сохранение текста в любой другой кодировке может привести к тому, что некоторые символы больше не будут отображаться. Например, документ, закодированный в Unicode, может содержать текст на иврите и кириллице. Если этот документ сохранен в кодировке кириллицы (Windows), текст на иврите больше не будет отображаться, а если документ сохранен в кодировке на иврите (Windows), текст на кириллице больше не будет отображаться.

Если вы выберете стандарт кодирования, который не поддерживает символы, которые вы использовали в файле, Word помечает красным цветом те символы, которые не может быть сохранен. Вы можете предварительно просмотреть текст в выбранном вами стандарте кодирования перед сохранением файла.

Текст, отформатированный шрифтом Symbol или кодами полей, удаляется из файла при сохранении файла как закодированного текста.

Выберите стандарт кодирования

Перейдите на вкладку "Файл".

Нажмите "Сохранить как".

Если вы хотите сохранить файл в другой папке, найдите и откройте ее.

В поле Имя файла введите новое имя файла.

В поле "Тип файла" выберите "Обычный текст".

Нажмите "Сохранить".

Если появится диалоговое окно средства проверки совместимости Microsoft Office Word, нажмите "Продолжить".

В диалоговом окне "Преобразование файла" выберите вариант стандарта кодирования, который вы хотите использовать:

Чтобы использовать стандарт кодирования по умолчанию для вашей системы, нажмите Windows (по умолчанию).

Чтобы использовать стандарт кодирования MS-DOS, щелкните MS-DOS.

Чтобы выбрать конкретный стандарт кодирования, нажмите «Другая кодировка», а затем выберите нужный стандарт кодирования из списка. Вы можете предварительно просмотреть текст в области предварительного просмотра, чтобы проверить, читается ли весь текст в выбранном стандарте кодирования.

Примечание. Размер диалогового окна "Преобразование файла" можно изменить, чтобы можно было просмотреть больше документов.

Если вы получили сообщение "Текст, выделенный красным, не будет правильно сохранен в выбранной кодировке", попробуйте выбрать другую кодировку или установите флажок "Разрешить замену символов".

Если вы разрешаете замену символов, Word заменяет символ, который не может быть отображен, на ближайший эквивалентный символ в выбранной вами кодировке. Например, три точки заменяют многоточие, а прямые кавычки заменяют фигурные кавычки.

Если в выбранной вами кодировке нет эквивалентного символа для символа, отмеченного красным, символ, отмеченный красным, будет сохранен как символ вне контекста, например вопросительный знак.

Если документ будет открыт в программе, которая не переносит текст с одной строки на другую, вы можете включить в документ жесткие разрывы строк, установив флажок Вставить разрывы строк, а затем указав, хотите ли вы, чтобы строки разрывы должны быть обозначены символом возврата каретки (CR), перевода строки (LF) или и тем, и другим в поле Конец строки с помощью поля.

Поиск стандартов кодирования, доступных в Word

Word распознает несколько стандартов кодирования и поддерживает стандарты кодирования, поставляемые с системным программным обеспечением на вашем компьютере.

В следующем списке систем письма показаны стандарты кодирования (также называемые кодовыми страницами), связанные с каждой системой письма.

Кодирование ваших файлов Excel в формат UTF (UTF-8 или UTF-16) может помочь обеспечить правильное чтение и отображение всего, что вы загружаете в Alchemer. Это особенно важно при работе с иностранными или специальными символами в кампаниях электронной почты, действиях с логином/паролем, списках контактов, импорте данных и тексте и переводах. Все эти функции позволяют получать загружаемые файлы CSV.

Существует несколько различных способов получить правильную кодировку UTF, поэтому мы рассмотрим, как это сделать в более старых версиях Microsoft Excel, OpenOffice, LibreOffice, Google Drive и даже как использовать для этого приложение Terminal!< /p>

Как кодировать файлы Excel

Ниже приведены ссылки на видеоролики и пошаговые инструкции по кодированию файлов Excel в кодировку UTF-8 и UTF-16. В Excel 2011 и более поздних версиях нет возможности кодировать файлы UTF.

В зависимости от вашей версии Excel вы можете закодировать файл в UTF-8 во время процесса Сохранить как. Это будет зависеть от вашей версии Excel, а также от того, используете ли вы Mac или ПК.

Версии Excel с 1999 по 2010

Excel для Mac

Хотя в старых версиях Excel для Mac нет возможности кодировать UTF-8 для CSV, в последней версии Excel это делается достаточно просто.

Краткое пошаговое видео: видео Open Office UTF-8

LibreOffice

Google Диск

Одним из широко доступных веб-решений для кодирования файлов XLS в формат UTF-8 CSV является Google Диск, также известный как Google Документы. Вы можете загрузить существующий файл и легко экспортировать его, выполнив следующие действия.

Использование терминала

В крайнем случае вы можете легко преобразовать файлы в кодировку UTF-8 с помощью терминала. Вам может потребоваться загрузить эту библиотеку, чтобы использовать команду iconv.

Для начала сохраните CSV-файл на рабочем столе с кратким именем файла.

Этапы Apple OSX

  1. Нажмите command+пробел, чтобы перейти к Spotlight, найдите «Терминал» и нажмите «Терминал», чтобы открыть его.
  2. По запросу введите приведенное ниже и нажмите Enter:
  3. Вставьте следующее:
  4. Измените имена файлов, чтобы они совпадали с именами на рабочем столе, и нажмите Enter.
  5. Вуаля! Ваш файл имеет кодировку UTF-8. Не открывайте файл после конвертации!

Этапы Windows

  1. Перейдите в меню "Пуск", введите "cmd" и нажмите cmd, чтобы открыть.
  2. По запросу введите следующее (заменив username своим именем пользователя Windows) и нажмите Enter:
  3. Вставьте следующее:
  4. Измените имена файлов, чтобы они совпадали с именами на рабочем столе, и нажмите Enter.
  5. Теперь ваш файл имеет кодировку UTF-8. Не открывайте файл после конвертации, загрузите его в нашу систему.

Фильтр: Базовый Стандарт Исследование рынка HR Professional Полный доступ Отчетность
Бесплатная отдельная команда и предприятие

Когда вы пишете документ на своем компьютере, текст представляется в определенной кодировке символов. Эта кодировка символов сообщает компьютеру, как хранить двоичный код в памяти компьютера и как отображать эту информацию на экране в зависимости от выбранного вами шрифта.

Марлоу умна, но не умеет читать файлы, записанные во всех возможных кодировках символов. По этой причине важно сохранять файлы в кодировке UTF-8. (Не волнуйтесь, это не так сложно!) Вот как это сделать в нескольких распространенных программах для редактирования текста.

Майкрософт Ворд

По умолчанию современные версии MS Word кодируют файлы в Unicode, и это должно быть нормально. Если у Марлоу возникают проблемы с вашей рукописью, преобразуйте ее в Unicode.

Это легко сделать! Используйте параметр «Сохранить как» в меню «Файл».

  1. Нажмите «Сохранить как», затем выберите «Обычный текст (.txt)» в раскрывающемся меню «Формат файла».
  2. Нажав кнопку "Сохранить", вы увидите новое окно с вопросом о кодировке текста.
  3. Выберите «Другая кодировка» и выберите UTF-8 в меню справа.
  4. Нажмите "ОК". Бум! Вот и все!

Страницы

Apple Pages автоматически кодирует текст в Unicode.

Просто выберите:

    Файл > Экспортировать в > Word

У Марлоу не возникнет проблем с чтением результата любого варианта.

Индизайн

К сожалению, напрямую преобразовать InDesign в .docx или обычный текст невозможно. Чтобы процесс работал, вам потребуется копия Adobe Acrobat Pro и копия Microsoft Word.

  1. Откройте файл в InDesign и выберите «Файл» > «Экспорт». В меню "Сохранить как" выберите Adobe PDF (печать) в качестве формата файла.
  2. Откройте новый PDF-файл в Acrobat Pro.
  3. В Acrobat Pro выберите «Файл» > «Экспортировать в» > «Microsoft Word» и выберите документ Word. В диалоговом окне «Сохранить как» нажмите кнопку «Настройки», если вам нужно изменить такие атрибуты, как «Настройки макета» и «Настройки изображения». Нажмите кнопку "Сохранить".
  4. Теперь откройте файл в Microsoft Word, выберите раскрывающийся список «Файл», затем нажмите «Сохранить как», затем выберите «Обычный текст (.txt)» в раскрывающемся меню «Формат файла».
  5. Нажав кнопку "Сохранить", вы увидите новое окно с вопросом о кодировке текста.
  6. Выберите «Другая кодировка» и выберите UTF-8 в меню справа.
  7. Нажмите "ОК".

Писатель

Процесс работы со Scrivener довольно прост, поскольку его функция компиляции текста сохраняет данные с использованием Unicode.

  1. Выберите «Скомпилировать» в меню «Файл».
  2. Выберите «Файл» > «Скомпилировать» и выберите «Выбрать обычный текст» (.txt) в диалоговом окне.
  3. Нажмите «Скомпилировать» и сохраните файл на свой компьютер.

Вы пишете в другой программе? Не стесняйтесь обращаться к нашей команде.

Часто почти невозможно узнать, был ли ваш CSV-файл закодирован как UTF-8. Программы не могут сказать вам наверняка, потому что в файле, содержащем эту информацию, нет настройки. Ближе всего к определению кодировки файла можно предположить или спросить человека, создавшего файл. Обычно человек, создающий файл, тоже не знает. Тогда все потеряно? Не совсем, вы можете создать свой собственный файл и сохранить его с известной кодировкой.

Выбор электронной таблицы в этом случае — OpenOffice или LibreOffice. Если вы используете Excel для выполнения всей своей работы, вам не повезло, поскольку в Excel нет возможности принудительно использовать кодировку при сохранении файла в формате CSV. Это не означает, что вы больше не можете использовать Excel, но при сохранении файла в формате CSV откройте файл Excel с помощью OpenOffice или LibreOffice.

Запустите OpenOffice/LibreOffice

В этом примере я буду использовать LibreOffice (экраны те же, что и для OpenOffice).

LibreOffice

Открыть файл

Нажмите «Открыть» и выберите файл на своем компьютере, который вы хотите сохранить как файл в кодировке UTF-8.

Сохраните файл

Мы не собираемся использовать CTRL-S для быстрого сохранения файла, но мы выбираем «Файл» -> «Сохранить как» (CTRL-SHIFT-S), после чего вы получаете этот экран:

LibreOffice Сохранить как

Есть несколько важных моментов:

  1. Назовите файл
  2. Тип файла должен быть "Текст CSV" (.csv).
  3. Необходимо включить Изменить настройки фильтра.

После этого нажмите Сохранить.

Настройка параметров фильтра

После того, как вы нажали «Сохранить», LibreOffice спросит вас, какие настройки вы хотите использовать для файла.

Экспорт настроек< бр />

Набор символов должен быть установлен в Unicode (UTF-8), так как это то, что мы хотим получить, файл в кодировке UTF-8.

Поле и текстовый разделитель вы можете установить по своему усмотрению или оставить как есть, все остальные настройки можно оставить без изменений.

Читайте также: