Изменитель кодировки файлов

Обновлено: 21.11.2024

Если у вас по-прежнему возникают проблемы с кодировкой, попробуйте выполнить следующие действия:

  1. Найти файл.
  2. Щелкните правой кнопкой мыши файл | нажмите "Открыть с помощью".
  3. Нажмите "Блокнот".
  4. Нажмите Файл | затем Сохранить как.
  5. Перейдите к папке, в которой вы хотите сохранить файл.
  6. Укажите имя для вашего файла.
  7. Добавить.
  8. Убедитесь, что установлена ​​кодировка UTF-8.

Как сохранить файл SRT в кодировке UTF-8?

Открыв файл субтитров в правильной кодировке символов, перейдите в меню «Файл» → «Сохранить как…» и измените параметр кодировки символов (опять же, в нижней части окна) на UTF-8 и сохраните файл (возможно, с новым именем в целях безопасности).

Как изменить ANSI на UTF-8?

Попробуйте «Настройки» -> «Настройки» -> «Новый документ» -> «Кодировка» -> выберите UTF-8 без спецификации и установите флажок «Применить к открытым файлам ANSI». Таким образом, все открытые файлы ANSI будут обрабатываться как UTF-8 без BOM.

Как узнать, является ли файл кодировкой UTF-8?

Откройте файл в Блокноте. Нажмите «Сохранить как». В поле со списком «Кодировка:» вы увидите текущий формат файла. Да, я открыл файл в блокноте, выбрал формат UTF-8 и сохранил его.

Как изменить кодировку файла в Linux?

Как изменить кодировку символов текстового файла в Linux

  1. Шаг первый. Определите кодировку символов в файле. Чтобы узнать кодировку файла, мы будем использовать инструмент с запятой под названием файл.
  2. Шаг 2. Узнайте, какие кодировки текста поддерживаются.
  3. Шаг 3. Преобразуйте кодировку текста.

Как изменить кодировку по умолчанию в Windows 10?

На левой панели щелкните правой кнопкой мыши клавишу «Блокнот» и выберите «Создать» -> «Значение DWORD (32-разрядное)». Назовите вновь созданный DWORD как iDefaultEncoding, а затем дважды щелкните его, чтобы изменить. В диалоговом окне «Изменить значение DWORD (32-разрядное)» введите значение новой кодировки по умолчанию и нажмите «ОК».

Как узнать кодировку файла?

Откройте файл с помощью обычного старого ванильного Блокнота, который входит в состав Windows. Он покажет вам кодировку файла, когда вы нажмете «Сохранить как». Какой бы ни была выбранная по умолчанию кодировка, это текущая кодировка файла.

Как изменить кодировку ANSI?

Как преобразовать текст в формат ANSI

  1. Нажмите кнопку "Пуск" Windows в левом нижнем углу экрана.
  2. Нажмите «Все программы» и откройте папку «Стандартные».
  3. Нажмите «Блокнот», чтобы запустить редактор.
  4. Найдите текстовый файл, который нужно преобразовать в ANSI, на компьютере.

Как изменить кодировку в Outlook?

1) В Outlook выберите пункт меню «Настройки» -> «Написание». 2) Параметр Предпочтительная кодировка для новых сообщений должен быть установлен в Unicode (UTF-8). 3) Когда вы изменили настройку кодировки текста, закройте окно, и ваши изменения будут сохранены.

В чем разница между UTF 8 и ANSI?

ANSI и UTF-8 – это две схемы кодирования символов, которые широко использовались в тот или иной момент времени. Основное различие между ними заключается в использовании, поскольку UTF-8 практически заменил ANSI в качестве предпочтительной схемы кодирования. Поскольку ANSI использует только один байт или 8 бит, он может представлять не более 256 символов.

В чем разница между UTF-8 и UTF-8?

Официальной разницы между UTF-8 и BOM-ed UTF-8 нет. Строка UTF-8, созданная по спецификации, будет начинаться с трех следующих байтов. ЭФ ББ БФ. Эти байты, если они есть, должны игнорироваться при извлечении строки из файла/потока.

Являются ли ANSI и Ascii одинаковыми?

Как правило, вы можете обмениваться текстовыми файлами, не беспокоясь о том, как хранится текст. Однако если вы делитесь текстовыми файлами с людьми, которые работают на других языках, загружаете текстовые файлы через Интернет или делитесь текстовыми файлами с другими компьютерными системами, вам может потребоваться выбрать стандарт кодирования при открытии или сохранении файла.

Когда вы или кто-то другой открывает текстовый файл в Microsoft Word или в другой программе — возможно, на компьютере с системным программным обеспечением на языке, отличном от языка, который использовался для создания файла — стандарт кодирования помогает в этом. программа определяет, как представить текст, чтобы он был удобочитаемым.

Что вы хотите сделать?

Знакомство с кодировкой текста

То, что кажется вам текстом на экране, на самом деле сохраняется в виде числовых значений в текстовом файле. Ваш компьютер переводит числовые значения в видимые символы. Это достигается с помощью стандарта кодирования.

Стандарт кодирования – это схема нумерации, при которой каждому текстовому символу в наборе символов присваивается числовое значение. Набор символов может включать буквы алфавита, цифры и другие символы.Разные языки обычно состоят из разных наборов символов, поэтому существует множество различных стандартов кодирования для представления наборов символов, используемых в разных языках.

Разные стандарты кодирования для разных алфавитов

Стандарт кодирования, сохраненный в текстовом файле, предоставляет информацию, необходимую вашему компьютеру для отображения текста на экране. Например, в кодировке кириллицы (Windows) символ Й имеет числовое значение 201. Когда вы открываете файл, содержащий этот символ, на компьютере, использующем кодировку кириллицы (Windows), компьютер считывает числовое значение 201 и отображает Й на экране.

Однако, если вы откроете тот же файл на компьютере, использующем другую кодировку, компьютер отобразит любой символ, соответствующий числовому значению 201 в стандарте кодировки, который компьютер использует по умолчанию. Например, если на вашем компьютере используется западноевропейский (Windows) стандарт кодировки, символ в исходном кириллическом файле будет отображаться как É, а не Й, поскольку в западноевропейской (Windows) кодировке значение 201 отображается на É.< /p>

Юникод: единый стандарт кодирования для многих алфавитов

Чтобы избежать проблем с кодировкой и декодированием текстовых файлов, вы можете сохранять файлы в кодировке Unicode. Юникод поддерживает большинство наборов символов для всех языков, которые сегодня широко используются пользователями компьютеров.

Поскольку Word основан на Unicode, Word автоматически сохраняет файлы, закодированные как Unicode. Вы можете открывать и читать файлы в кодировке Unicode на своем англоязычном компьютере независимо от языка текста. Аналогичным образом, когда вы используете англоязычную систему для сохранения файлов в кодировке Unicode, файл может содержать символы, не встречающиеся в западноевропейских алфавитах, например символы греческого, кириллического, арабского или японского языков.

Выберите стандарт кодирования при открытии файла

Если при открытии файла текст отображается искаженным, в виде вопросительных знаков или прямоугольников, возможно, Word не точно определил стандарт кодирования текста в файле. Вы можете указать стандарт кодирования, который можно использовать для отображения (декодирования) текста.

Перейдите на вкладку "Файл".

Нажмите "Параметры".

Нажмите "Дополнительно".

Прокрутите до раздела "Общие" и установите флажок "Подтверждать преобразование формата файла при открытии".

Примечание. Если этот флажок установлен, Word отображает диалоговое окно «Преобразовать файл» каждый раз, когда вы открываете файл в формате, отличном от формата Word (форматы Word включают .doc, .dot, .docx, .docm, . файлы dotx или .dotm). Если вы часто работаете с такими файлами, но редко хотите выбирать стандарт кодирования, не забудьте отключить этот параметр, чтобы это диалоговое окно не открывалось без необходимости.

Закройте и снова откройте файл.

В диалоговом окне "Преобразовать файл" выберите "Закодированный текст".

В диалоговом окне "Преобразование файла" выберите "Другая кодировка", а затем выберите нужный стандарт кодировки из списка.

Вы можете предварительно просмотреть текст в области предварительного просмотра, чтобы проверить, читается ли весь текст в выбранном стандарте кодирования.

Если почти весь текст выглядит одинаково (например, все прямоугольники или все точки), возможно, не установлен шрифт, необходимый для отображения символов. Если нужный вам шрифт недоступен, вы можете установить дополнительные шрифты.

Чтобы установить дополнительные шрифты, выполните следующие действия:

В Microsoft Windows нажмите кнопку "Пуск" и выберите "Панель управления".

Выполните одно из следующих действий:

В Windows 7

На панели управления нажмите "Удалить программу".

В списке программ выберите Microsoft Office или Microsoft Word, в зависимости от того, установили ли вы Word как часть Office или как отдельную программу, а затем нажмите Изменить.

В Windows Vista

На панели управления нажмите "Удалить программу".

В списке программ выберите Microsoft Office или Microsoft Word, в зависимости от того, установили ли вы Word как часть Office или как отдельную программу, а затем нажмите Изменить.

В Microsoft Windows XP

На панели управления нажмите "Установка и удаление программ".

В поле Установленные программы щелкните список Microsoft Office или Microsoft Word, в зависимости от того, установили ли вы Word как часть Office или как отдельную программу, а затем нажмите Изменить.

В разделе "Изменить установку Microsoft Office" нажмите "Добавить или удалить компоненты", а затем нажмите "Продолжить".

В разделе «Параметры установки» разверните «Общие функции Office», а затем разверните «Международная поддержка».

Выберите нужный набор шрифтов, нажмите стрелку рядом с выбором и выберите «Запустить с моего компьютера».

Совет. Когда вы открываете закодированный текстовый файл, Word применяет шрифты, указанные в диалоговом окне "Параметры веб-сайта". (Чтобы открыть диалоговое окно веб-параметров, нажмите кнопку Microsoft Office, выберите «Параметры Word» и нажмите «Дополнительно».В разделе «Общие» нажмите «Параметры Интернета».) Вы можете выбрать параметры на вкладке «Шрифты» в диалоговом окне «Параметры Интернета», чтобы настроить шрифт для каждого набора символов.

Выберите стандарт кодирования при сохранении файла

Если вы не выберете стандарт кодировки при сохранении файла, Word кодирует файл как Unicode. Обычно можно использовать кодировку Unicode по умолчанию, поскольку она поддерживает большинство символов большинства языков.

Если ваш документ будет открыт в программе, не поддерживающей Unicode, вы можете выбрать стандарт кодирования, соответствующий стандарту целевой программы. Например, Unicode позволяет создать документ на традиционном китайском языке в англоязычной системе. Однако, если документ будет открыт в программе на традиционном китайском языке, которая не поддерживает Unicode, вы можете сохранить документ в кодировке традиционного китайского языка (Big5). Когда документ открывается в программе на традиционном китайском языке, весь текст отображается правильно.

Примечание. Поскольку Unicode является наиболее полным стандартом, сохранение текста в любой другой кодировке может привести к тому, что некоторые символы больше не будут отображаться. Например, документ, закодированный в Unicode, может содержать текст на иврите и кириллице. Если этот документ сохранен с кодировкой кириллицы (Windows), текст на иврите больше не будет отображаться, а если документ сохранен с кодировкой на иврите (Windows), текст на кириллице больше не будет отображаться.

Если вы выберете стандарт кодировки, который не поддерживает символы, которые вы использовали в файле, Word помечает красным цветом те символы, которые не может быть сохранен. Вы можете предварительно просмотреть текст в выбранном вами стандарте кодирования перед сохранением файла.

Текст, отформатированный шрифтом Symbol или кодами полей, удаляется из файла при сохранении файла как закодированного текста.

Выберите стандарт кодирования

Перейдите на вкладку "Файл".

Нажмите "Сохранить как".

Если вы хотите сохранить файл в другой папке, найдите и откройте ее.

В поле Имя файла введите новое имя файла.

В поле "Тип файла" выберите "Обычный текст".

Нажмите "Сохранить".

Если появится диалоговое окно средства проверки совместимости Microsoft Office Word, нажмите "Продолжить".

В диалоговом окне "Преобразование файла" выберите вариант стандарта кодирования, который вы хотите использовать:

Чтобы использовать стандарт кодирования по умолчанию для вашей системы, нажмите Windows (по умолчанию).

Чтобы использовать стандарт кодирования MS-DOS, щелкните MS-DOS.

Чтобы выбрать конкретный стандарт кодирования, нажмите «Другая кодировка», а затем выберите нужный стандарт кодирования из списка. Вы можете предварительно просмотреть текст в области предварительного просмотра, чтобы проверить, читается ли весь текст в выбранном стандарте кодирования.

Примечание. Размер диалогового окна "Преобразование файла" можно изменить, чтобы можно было просмотреть больше документов.

Если вы получили сообщение "Текст, выделенный красным цветом, не будет корректно сохранен в выбранной кодировке", попробуйте выбрать другую кодировку или установите флажок "Разрешить замену символов".

Если вы разрешаете замену символов, Word заменяет символ, который не может быть отображен, на ближайший эквивалентный символ в выбранной вами кодировке. Например, три точки заменяют многоточие, а прямые кавычки заменяют фигурные кавычки.

Если в выбранной вами кодировке нет эквивалентного символа для символа, отмеченного красным, символ, отмеченный красным, будет сохранен как символ вне контекста, например вопросительный знак.

Если документ будет открыт в программе, которая не переносит текст с одной строки на другую, вы можете включить в документ жесткие разрывы строк, установив флажок Вставить разрывы строк, а затем указав, хотите ли вы, чтобы строки разрывы должны быть обозначены символом возврата каретки (CR), перевода строки (LF) или и тем, и другим в поле Конец строки с помощью поля.

Поиск стандартов кодирования, доступных в Word

Word распознает несколько стандартов кодирования и поддерживает стандарты кодирования, поставляемые с системным программным обеспечением на вашем компьютере.

В следующем списке систем письма показаны стандарты кодирования (также называемые кодовыми страницами), связанные с каждой системой письма.

Примечание. Исходный файл обрабатывается как текстовые данные с указанным набором символов. Текстовое поле обрабатывается как строковые данные, набор символов по умолчанию для текстового поля совпадает с кодировкой этого документа (utf-8).

Файл кодировки и конвертер текста

  • конвертировать исходные файлы в любой кодировке в строку Unicode utf-8
  • преобразовывать строки непосредственно из ввода HTML и экспортировать их в файл.
  • подготовленные наборы символов: windows-1250,iso-8859-1,iso-8859-2,utf-8,utf-7,ibm852,shift_jis,iso-2022-jp, вы можете использовать любой другой набор символов из списка ConvertCodePages .

Ссылки на конвертер кодировок

Другие онлайн-примеры (утилиты, конвертация, загрузка)

Интерактивный декодер и кодировщик base64 — позволяет преобразовывать текстовые данные и файлы из/в строку Base64.
Декодер и кодировщик Punycode/IDN - онлайн-преобразование между Unicode (utf-8), punycode и IDN (интернационализированными доменными именами)
Кодировщик URL, экранирование с преобразованием кодировки
Декодер URL, декодирование с кодировкой Преобразование онлайн-бинарного файла в поле SQL (HexString или base16) — позволяет создать оператор SQL для вставки/обновления двоичного или текстового файла в поле базы данных SQL. Вы также можете создать весь WSH (VBScript) для выполнения действия.
Онлайн конвертер кодовых страниц и кодировок текста и файлов - позволяет конвертировать текст, html и файлы между многими кодовыми страницами.
Прямая загрузка с примером выполнения — простая загрузка файлов в ASP с индикатором выполнения.
Прямая загрузка с предварительным просмотром изображения. Загрузка со множеством дополнительных функций: предварительный просмотр изображения, предварительный просмотр размера и проверка типа файла (перед загрузкой), проверка типа файла на стороне сервера, содержимого файла, размера файла и размера загрузки и многое другое.
Восстановление пароля IAF - восстановление паролей из вашего файла IAF.
Онлайн-генератор файлов IAF. Создайте файл конфигурации учетной записи электронной почты для Outlook Express в Интернете.
Онлайн-декодер IAF — декодируйте файлы конфигурации IAF онлайн.
Генератор конфигурации Gmail pop и smtp — конфигурация Outlook для Gmail.
Онлайн-образец кодировщика в кавычках.
онлайн-образец декодера для печати в кавычках.

В этом руководстве мы опишем, что такое кодировка символов, и рассмотрим несколько примеров преобразования файлов из одной кодировки символов в другую с помощью инструмента командной строки. Затем, наконец, мы рассмотрим, как преобразовать несколько файлов из любого набора символов (charset) в кодировку UTF-8 в Linux.

Как вы, возможно, уже помните, компьютер не понимает и не хранит буквы, цифры или что-то еще, что мы, люди, можем воспринимать, кроме битов. Бит имеет только два возможных значения: 0 или 1, true или false, yes или no. Все остальные элементы, такие как буквы, цифры, изображения, должны быть представлены в битах для обработки компьютером.

Проще говоря, кодировка символов — это способ сообщить компьютеру, как интерпретировать необработанные нули и единицы в фактические символы, где символ представлен набором чисел. Когда мы набираем текст в файле, слова и предложения, которые мы формируем, составлены из разных символов, а символы организованы в кодировку.

Существуют различные схемы кодирования, такие как ASCII, ANSI, Unicode и другие. Ниже приведен пример кодировки ASCII.

В Linux инструмент командной строки iconv используется для преобразования текста из одной формы кодировки в другую.

Вы можете проверить кодировку файла с помощью команды file, используя флаг -i или --mime, который позволяет печатать строку типа mime, как в примерах ниже:

Синтаксис для использования iconv следующий:

Где -f или --from-code означает входную кодировку, а -t или --to-encoding указывает выходную кодировку.

Чтобы получить список всех известных наборов кодированных символов, выполните следующую команду:

Преобразование файлов из кодировки UTF-8 в кодировку ASCII

Далее мы узнаем, как преобразовать одну схему кодирования в другую. Приведенная ниже команда преобразует кодировку ISO-8859-1 в UTF-8.

Рассмотрите файл с именем input.file, который содержит символы:

Давайте начнем с проверки кодировки символов в файле, а затем просмотрим содержимое файла. Точно так же мы можем преобразовать все символы в кодировку ASCII.

После запуска команды iconv мы проверяем содержимое выходного файла и новую кодировку символов, как показано ниже.

Примечание. Если к кодировке добавляется строка //IGNORE, символы, которые нельзя преобразовать, и после преобразования отображается ошибка.

Опять же, предположим, что строка //TRANSLIT добавлена ​​в to-encoding, как в приведенном выше примере (ASCII//TRANSLIT), преобразуемые символы транслитерируются по мере необходимости и, если это возможно. Это означает, что в случае, если символ не может быть представлен в целевом наборе символов, он может быть аппроксимирован одним или несколькими похожими символами.

Следовательно, любой символ, который не может быть транслитерирован и не входит в целевой набор символов, заменяется в выходных данных вопросительным знаком (?).

Конвертировать несколько файлов в кодировку UTF-8

Возвращаясь к нашей основной теме, чтобы преобразовать несколько или все файлы в каталоге в кодировку UTF-8, вы можете написать небольшой сценарий оболочки с именем encoding.sh следующим образом:

Сохраните файл, затем сделайте скрипт исполняемым. Запустите его из каталога, где находятся ваши файлы ( *.txt ).

Важно: Вы также можете использовать этот скрипт для общего преобразования нескольких файлов из одной заданной кодировки в другую, просто поэкспериментируйте со значениями переменных FROM_ENCODING и TO_ENCODING, не забывая имя выходного файла "$.utf8.converted". " .

Для получения дополнительной информации просмотрите справочную страницу iconv.

Подводя итог этому руководству, можно сказать, что понимание кодировки и способов преобразования из одной схемы кодирования символов в другую необходимы каждому пользователю компьютера, а тем более программистам, когда дело касается работы с текстом.

Наконец, вы можете связаться с нами, используя раздел комментариев ниже для любых вопросов или отзывов.

Если вам понравилась эта статья, подпишитесь на уведомления по электронной почте о руководствах по Linux. Если у вас есть вопросы или сомнения? обратитесь за помощью в разделе комментариев.

Если вы цените то, что мы делаем здесь, в TecMint, вам следует подумать о следующем:

TecMint – это самый быстрорастущий и пользующийся наибольшим доверием сайт сообщества, где можно найти любые статьи, руководства и книги по Linux в Интернете. Миллионы людей посещают TecMint! для поиска или просмотра тысяч опубликованных статей, доступных всем БЕСПЛАТНО.

Если вам нравится то, что вы читаете, купите нам кофе (или 2) в знак признательности.

Читайте также: