Как сохранить CSV в utf 8 из Excel
Обновлено: 21.11.2024
В статье рассматриваются быстрые и эффективные способы экспорта данных из Excel в CSV с сохранением всех специальных символов и иностранных символов. Методы работают для всех версий Excel, от 365 до 2007.
Значения, разделенные запятыми (CSV), – это широко используемый формат, в котором табличные данные (числа и текст) хранятся в виде обычного текста. Его популярность и жизнеспособность обусловлены тем, что файлы CSV поддерживаются многими различными приложениями и системами, по крайней мере, в качестве альтернативного формата импорта/экспорта. Формат CSV позволяет пользователям взглянуть на файл и сразу диагностировать проблемы с данными, изменить разделитель, квалификатор текста и т. д. Все это возможно, потому что документ CSV представляет собой обычный текст, и его может легко понять обычный пользователь или даже новичок. без обучения.
Форматы CSV, поддерживаемые Excel
Microsoft Excel позволяет сохранять файл в нескольких различных форматах CSV, и вам может быть интересно узнать о различиях между ними.
По сути, каждый формат CSV сохраняет данные в виде значений, разделенных запятыми, но кодирует их немного по-разному. Например, Mac использует один символ возврата каретки ( ), представленный \r для разрыва строки, а Windows использует комбинацию возврата каретки и перевода строки ( ), представленную \r\n.
Чтобы правильно экспортировать данные в другие программы, Excel позволяет выбрать формат CSV, который лучше всего соответствует ожиданиям программы.
Вот параметры CSV, доступные в Excel 365. В вашей версии список может выглядеть немного иначе.
CSV (с разделителями-запятыми). В этом формате данные сохраняются в текстовом файле с разделителями-запятыми, который можно использовать в другой программе Windows или другой версии операционной системы Windows.
CSV (для Macintosh). В этом формате рабочая книга сохраняется в виде файла с разделителями-запятыми для использования в операционной системе Mac.
CSV (MS-DOS). Сохраняет как документ с разделителями-запятыми для использования в операционной системе MS-DOS.
Помимо CSV, есть еще один формат, который может оказаться очень удобным для связи с другими программами.
Текст Unicode (*.txt). Это стандарт компьютерной индустрии, поддерживаемый почти всеми современными операционными системами, включая Windows, Macintosh, Linux и Solaris Unix. Он может обрабатывать символы почти всех современных языков и некоторых древних языков.
Примечание. По строгому определению формат CSV подразумевает разделение значений запятыми. На самом деле вы можете встретить много других разделителей, чаще всего это точка с запятой и табуляция.
Как преобразовать файл Excel в CSV
Если данные Excel необходимо перенести в другое приложение, например в адресную книгу Outlook или базу данных Access, проще всего сохранить рабочий лист в виде файла .csv, а затем импортировать этот файл в другую программу.
Чтобы сохранить файл Excel (.xlsx или .xls) в формате CSV, выполните следующие действия:
Если на вашем листе есть какое-либо форматирование, формулы, диаграммы, фигуры или другие объекты, вы будете проинформированы о том, что некоторые функции в вашей книге могут быть потеряны, если вы сохраните ее в формате CSV (с разделителями-запятыми). Если все в порядке, нажмите Да, чтобы завершить преобразование без неподдерживаемых функций.
Экспорт Excel в CSV без уничтожения специальных символов
Если ваша электронная таблица содержит специальные символы, умные кавычки или длинные тире (например, унаследованные от документа Word), иностранные символы (тильды, диакритические знаки и т. д.) или иероглифы, описанный выше метод не сработает.
Дело в том, что сохранение в формате CSV (с разделителями-запятыми) искажает любые символы, кроме ASCII (американский стандартный код для обмена информацией).
Прежде чем мы перейдем к этапам экспорта, давайте укажем на ключевые особенности каждой кодировки, чтобы вы могли выбрать формат, подходящий для конкретного случая.
UTF-8 – более компактная кодировка, поскольку в ней для каждого символа используется от 1 до 4 байтов. Как правило, этот формат рекомендуется, если символы ASCII преобладают в вашем файле, поскольку большинство таких символов хранятся в одном байте каждый. Еще одним преимуществом является то, что файл UTF-8, содержащий только символы ASCII, имеет абсолютно ту же кодировку, что и файл ASCII.
UTF-16 использует от 2 до 4 байтов для кодирования каждого символа. Однако для файла UTF-16 не всегда требуется больше памяти, чем для файла UTF-8. Например, японские символы занимают от 3 до 4 байтов в UTF-8 и от 2 до 4 байтов в UTF-16. Таким образом, вы можете захотеть использовать UTF-16, если ваши данные содержат какие-либо азиатские символы, включая японские, китайские или корейские.Заметным недостатком этого формата является то, что он не полностью совместим с файлами ASCII и требует, чтобы некоторые программы, поддерживающие Unicode, отображали их. Имейте это в виду, если вы собираетесь импортировать полученный документ куда-то за пределы Excel.
После того как вы определились с форматом, приведенные ниже инструкции помогут вам в этом.
Как конвертировать Excel в CSV UTF-8
Предположим, у вас есть рабочий лист с некоторыми иностранными символами, в нашем случае японскими именами:
В зависимости от используемой вами версии Excel может потребоваться от 3 до 5 шагов, чтобы преобразовать этот файл в CSV с сохранением всех специальных символов.
Экспорт в CSV UTF-8 в Excel 2016–365
В Excel 2016 и более поздних версиях вы можете напрямую сохранить файл в формате CSV с кодировкой UTF-8:
Преобразование в CSV UTF-8 в Excel 2013–2007
Поскольку старые версии Excel не поддерживают кодировку UTF-8, вам необходимо сначала сохранить документ в текстовом формате Unicode, а затем преобразовать его в UTF-8.
Чтобы экспортировать файл Excel в CSV и сохранить специальные символы, выполните следующие действия:
Примечание. Некоторые простые текстовые редакторы не полностью поддерживают все символы Unicode, поэтому некоторые символы могут отображаться в виде прямоугольников. В большинстве случаев это не повлияет на результирующий файл, поэтому вы можете просто игнорировать это или использовать более продвинутый текстовый редактор, такой как Notepad++.
-
Выберите любой символ табуляции, щелкните его правой кнопкой мыши и выберите «Копировать» в контекстном меню или нажмите комбинацию клавиш Ctrl + C.
Если вам нужен CSV-файл, разделенный точкой с запятой, замените табуляцию точкой с запятой.
Если все сделано правильно, итоговый файл txt должен выглядеть примерно так:
- В поле Имя файла измените расширение .txt на .csv.
- В поле Тип файла выберите Все файлы (*.*).
- В раскрывающемся меню Кодировка выберите UTF-8 со спецификацией.
По завершении нажмите кнопку Сохранить.
- Знак порядка байтов (BOM) представляет собой последовательность байтов в начале текстового потока, указывающую на кодировку Unicode текстового документа. В случае UTF-8 с BOM последовательность 0xEF,0xBB,0xBF сигнализирует программе чтения, что в файле используется кодировка UTF-8. Стандарт Unicode разрешает, но не требует спецификации в UTF-8. Однако часто это имеет решающее значение для правильного распознавания UTF-8 в Excel, особенно при преобразовании из азиатских языков.
- Если ваш текстовый редактор не позволяет изменить расширение файла, вы можете сделать это в проводнике Windows.
Теперь вы можете открыть CSV-файл в Excel и убедиться, что все данные отображаются правильно:
Примечание. Если ваш файл предназначен для использования в другом приложении, где формат UTF-8 является обязательным, не вносите никаких изменений и не сохраняйте файл в Excel, так как это может вызвать проблемы с кодировкой. Если какие-то данные не отображаются прямо в Excel, откройте файл в Блокноте и исправьте там данные. Не забудьте снова сохранить файл в формате UTF-8 с BOM.
Как конвертировать файл Excel в CSV UTF-16
Экспорт в CSV UTF-16 выполняется почти так же, как и в CSV UTF-8:
- Сохраните книгу в текстовом формате Unicode (*.txt).
- Откройте документ .txt в текстовом редакторе, например в Блокноте, и замените все табуляции запятыми.
- Измените расширение файла на .csv, убедитесь, что установлена кодировка UTF-16 LE, и сохраните файл.
Преобразование нескольких листов Excel в CSV
Как уже упоминалось, команда Excel Сохранить как может преобразовать только активный рабочий лист. Но что, если ваша книга содержит много разных листов, и вы хотите превратить их все в отдельные CSV-файлы? Единственная альтернатива, предложенная Microsoft, — это сохранение каждого листа под другим именем файла, что звучит не очень вдохновляюще, не так ли?
Итак, есть ли быстрый способ сохранить сразу несколько листов Excel в формате CSV? Да, это можно сделать с помощью VBA.
Приведенный ниже код преобразует все рабочие листы в текущей книге в отдельные файлы CSV, по одному для каждого листа. Имена файлов создаются из имен книг и листов (WorkbookName_SheetName.csv) и сохраняются в той же папке, что и исходный документ.
Имейте в виду, что приведенный выше код сохраняет листы в формате CSV. Если в ваших данных есть символы, отличные от ASCII, вам необходимо преобразовать их в UTF-8 CSV. Это можно сделать, изменив формат файла с xlCSV на xlCSVUTF8. То есть вы заменяете FileFormat:=xlCSV на FileFormat:=xlCSVUTF8.
Кроме того, помните, что преобразования CSV UTF-8 возможны в Excel 2016 и более поздних версиях.
Следующие рекомендации помогут вам добавить макрос в книгу: Как вставить и запустить код VBA в Excel.
Помимо методов, описанных выше, существует несколько других способов преобразования листов Excel в формат CVS. Ниже я поделюсь парой моих любимых.
Из Excel в CSV с помощью таблиц Google
Использование таблиц Google для преобразования .xlsx в .csv кажется очень простым решением:
Совет. Если у вас относительно небольшой набор данных, может быть проще скопировать/вставить его непосредственно в электронную таблицу.
Откройте загруженный файл в любом текстовом редакторе, чтобы убедиться, что все данные экспортированы правильно.
Примечание. Если ваш исходный лист Excel содержит специальные символы, полученный CSV-файл может неправильно отображать символы при открытии в Excel, хотя во многих других программах для работы с электронными таблицами он выглядит идеально.
Сохраните .xlsx в .xls, а затем преобразуйте в .csv
Этот метод преобразования Excel в CSV вряд ли нуждается в дополнительных пояснениях, потому что в заголовке все сказано :)
Я наткнулся на это решение на каком-то форуме, не помню на каком именно. Честно говоря, у меня этот метод никогда не работал, но многие пользователи сообщали, что специальные символы, которые терялись при сохранении .xlsx напрямую в .csv, сохраняются, если сначала сохранить файл .xlsx в .xls, а затем сохранить .xls как .csv, как описано в разделе Как преобразовать Excel в CSV.
В любом случае вы можете попробовать этот метод экспорта Excel в CSV на своей стороне, и если он сработает, это может реально сэкономить время.
Преобразование Excel в CSV с помощью OpenOffice
OpenOffice – это набор из шести приложений с открытым исходным кодом. Одним из них является приложение для работы с электронными таблицами под названием Calc, которое отлично подходит для экспорта данных электронных таблиц в формат CSV. На самом деле он предоставляет больше возможностей (кодировки, разделители и т. д.), чем Microsoft Excel и Google Таблицы вместе взятые.
Чтобы преобразовать файл Excel в CSV, выполните следующие действия:
- Откройте документ Excel с помощью OpenOffice Calc.
- Нажмите Файл > Сохранить как… и выберите текстовый файл CSV (.csv) в раскрывающемся меню Тип файла.
- Далее вам будет предложено определить кодировку и разделители. Если вашей целью является формат CVS, который правильно обрабатывает специальные символы, выберите:
- Юникод (UTF-8) для набора символов.
- Запятая для разделителя полей. Если вам нужен CSV-файл, разделенный точкой с запятой, выберите точку с запятой (;) или любой другой разделитель.
- Кавычки для разделителя текста.
Чтобы завершить преобразование, нажмите ОК.
Было бы здорово, если бы Excel предоставлял аналогичные возможности для быстрого и безболезненного преобразования CSV, не так ли?
Это известные мне способы преобразования Excel в CSV. Если вы знаете другие более эффективные методы, поделитесь ими в комментариях. Спасибо за прочтение!
Вас также может заинтересовать
69 комментариев к статье "Как конвертировать файлы Excel в CSV (с разделителями-запятыми) и CSV UTF-8"
Я ищу простой способ просто экспортировать текущий лист в csv, но сохранить мою книгу xlsx нетронутой. Я часто сохраняю как csv и забываю сохранить свою книгу как xlsx и потерять всю свою работу. Я пропустил более простой способ?
большое спасибо
Я сохранил лист Excel в формате CSV, чтобы экспортировать его, но когда я импортирую его в программное обеспечение моей компании, он добавляет '' перед первой ячейкой в каждой строке. Это вызывает проблемы.
Этого не было, когда я делал то же самое с Excel 2007. Эта проблема началась только при обновлении до Excel 2010.
Есть идеи, как мне избавиться от этого ''?
У меня есть 1500 файлов Excel, если я изменяю один за другим, для преобразования требуется 3 дня, я ищу преобразование одновременно. Пожалуйста, помогите мне.
Спасибо,
Ачинтья Мондал
Привет, я столкнулся с проблемой при создании отправки, даже я даю 6-10 буквенно-цифровых символов, но не принимаю, что делать?? помогите мне
Привет!
Большое спасибо за это - после борьбы просто "сохранить как csv". возможность преобразования xlsx в xls в csv. помогло, когда я пытался импортировать базу данных адресов электронной почты в GMAIL. Какое облегчение! СПАСИБО!!
Здравствуйте, IAM столкнулся с проблемой при сохранении файла в формате csv, он говорит, что некоторые функции будут потеряны, и да, после загрузки данных в среду weka IAM получает только 1 функцию из 41 функции. если кто-то может помочь, пожалуйста.
Уважаемые господа/госпожа,
Когда я пытаюсь сохранить как excel в csv, пункт №. 5 не появилось:
"При нажатии кнопки "ОК" в первом диалоговом окне отобразится второе сообщение, информирующее вас о том, что ваш рабочий лист может содержать функции, не поддерживаемые кодировкой CSV. Это нормально, поэтому просто нажмите "Да".
Ваша помощь очень ценна
Здравствуйте,
У меня возникла проблема, когда я пытаюсь преобразовать электронную таблицу Excel в CSV, и ячейка, содержащая текст в кавычках, например "Здравствуйте", всегда преобразуется как """Здравствуйте""" в файле CSV. У меня заканчиваются идеи, не могли бы вы помочь мне найти способ сохранить данные без изменений, спасибо. Антеро
Значения, разделенные запятыми (CSV), – это полезная функция, наглядно используемая для сохранения табличных данных в простом текстовом формате. Они имеют значение в мире приложений и программирования для наилучшего использования данных путем импорта или экспорта данных из файлов Excel. Формат CSV помогает пользователям быстро просматривать данные и при необходимости вносить исправления. Изменения, такие как заключение значений в кавычки и разделитель, вносятся легко.
Это возможно, потому что данные представлены в простом формате, легко понятном новому пользователю, не имеющему большого опыта работы с ним. Представленная ниже информация помогает на примерах понять процесс преобразования данных Excel в CSV без повреждения символов и специальных символов.
Как конвертировать Excel в CSV?
Вот примеры преобразования Excel в файл CSV.
В этом примере показано преобразование простого листа Excel в формат CSV
-
На первом этапе перейдите к кнопке Microsoft Office (версия 2007 г.) или вкладке «Файл» (версия 2013 г.) и выберите параметр «Сохранить как» или нажмите клавишу F12, чтобы отобразить диалоговое окно «Сохранить как».
Этот пример иллюстрирует формат Excel CSV UTF-8 Excel CSV UTF-8. В случае, если Excel содержит какие-либо умные кавычки или любые другие языковые данные при преобразовании данных из Excel в CSV, он не будет точно преобразован и в конечном итоге получит вопросительные знаки. . Используя Excel CSV UTF8 в качестве кодировки, мы можем легко выбрать формат файла и язык. читать больше с CSV. Если лист Excel содержит специальные символы и данные на других языках, они не отображаются должным образом. Для правильного отображения файл Excel преобразуется с использованием кодировки UTF-8, как показано на рисунке.
- Во-первых, лист Excel необходимо преобразовать в текстовый формат Unicode, используя тот же тип, что и .txt. Это приводит к пробелу между данными в строке.
- Пространство табуляции заменяется запятыми, преобразующими данные в файл с разделителями-запятыми.
- На этом этапе формат файла .txt преобразуется в CSV с помощью параметра «Сохранить как» или изменения имени файла Excel с расширением .csv.
Преобразовать Excel в CSV очень просто, так как кодировка UTF-16 выполняется в два этапа.
Электронные таблицы Google помогают преобразовывать данные в формат CSV через Интернет, выполнив пять шагов.
Объяснение преобразования Excel в файл CSV
Пользователь должен использовать любую доступную технологию для преобразования листа Excel в формат CSV.При открытии или преобразовании файлов CSV и внесении изменений в форматы требуется правильная обработка предупреждений и сообщений безопасности. Данные, представленные на любом языке, легко конвертировать с помощью UTF-8.
Прежде всего необходимо преобразовать данные в текстовый формат, изменив формат файла на .txt. Данные отображаются, как показано ниже.
Данные следует преобразовать в формат с разделителями-запятыми, заменив пробел запятой. После этого формат файла следует сохранить в .CSV из текстового формата.
Как использовать файлы CSV?
Файлы CSV используются Data Scientist для визуализации табличных данных. Они легко извлекаются в различные приложения при создании баз данных в Excel Создание баз данных в Excel Когда мы вводим данные в Excel в виде таблиц со строками и столбцами и даем каждой таблице имя, мы создаем базу данных. читать больше и таблицы. Существует два способа использования CSV-файлов веб-разработчиком, в том числе
- Легко импортировать в базы данных независимо от программного обеспечения, используемого для разработки веб-сайта.
- Улучшение управления большими объемами данных возможно благодаря тому, что данные представлены в текстовом формате без каких-либо формул.
Для эффективного использования CSV-файлов необходимо импортировать их в такие приложения, как базы данных, и преобразовывать их в таблицы для дальнейшего анализа данных. Это упрощает принятие точных решений.
Например, когда мы импортировали данные о клиентах в таблицу Excel, адреса клиентов находятся в разных столбцах, и для копирования данных из разных ячеек требуется время. CSV помогает лучше справиться с этой ситуацией, разделяя данные запятыми.
Что следует помнить при преобразовании Excel в CSV
Для успешного преобразования файлов Excel в CSV необходимо помнить следующее.
- Необходимо правильно выбрать различные форматы CSV, доступные на листе Excel, например CSV для Macintosh, CSV для MS-DOS и текст Unicode. Соответствующий формат следует выбирать в зависимости от требований пользователя.
- Единовременно только один активный лист книги Excel преобразуется в формат CSV.
- При импорте данных в приложение для обработки текста пробел следует заменить запятой, чтобы успешно преобразовать его в значения, разделенные запятыми.
- Пользователь может использовать бесплатные инструменты, доступные в Интернете, для преобразования листа Excel в формат CSV без особых усилий.
- Невозможно преобразовать все листы книги Excel одновременно.
Рекомендуемые статьи
Это руководство по преобразованию файлов Excel в CSV. Здесь мы обсуждаем, как преобразовать Excel в файл CSV, а также практические примеры и загружаемый шаблон Excel. Вы можете узнать больше об Excel из следующих статей –
Часто почти невозможно узнать, был ли ваш CSV-файл закодирован как UTF-8. Программы не могут сказать вам наверняка, потому что в файле, содержащем эту информацию, нет настройки. Ближе всего к определению кодировки файла можно предположить или спросить человека, создавшего файл. Обычно человек, создающий файл, тоже не знает. Тогда все потеряно? Не совсем, вы можете создать свой собственный файл и сохранить его с известной кодировкой.
Выбор электронной таблицы в этом случае — OpenOffice или LibreOffice. Если вы используете Excel для выполнения всей своей работы, вам не повезло, поскольку в Excel нет возможности принудительно использовать кодировку при сохранении файла в формате CSV. Это не означает, что вы больше не можете использовать Excel, но при сохранении файла в формате CSV откройте файл Excel с помощью OpenOffice или LibreOffice.
Запустите OpenOffice/LibreOffice
В этом примере я буду использовать LibreOffice (экраны те же, что и для OpenOffice).
Открыть файл
Нажмите «Открыть» и выберите файл на своем компьютере, который вы хотите сохранить как файл в кодировке UTF-8.
Сохраните файл
Мы не собираемся использовать CTRL-S для быстрого сохранения файла, но мы выбираем «Файл» -> «Сохранить как» (CTRL-SHIFT-S), после чего вы получаете этот экран:
Есть несколько важных моментов:
- Назовите файл
- Тип файла должен быть "Текст CSV" (.csv).
- Необходимо включить Изменить настройки фильтра.
После этого нажмите Сохранить.
Настройка параметров фильтра
После того, как вы нажали «Сохранить», LibreOffice спросит вас, какие настройки вы хотите использовать для файла.
Набор символов должен быть установлен в Unicode (UTF-8), так как это то, что мы хотим получить, файл в кодировке UTF-8.
Поле и текстовый разделитель вы можете установить по своему усмотрению или оставить как есть, все остальные настройки можно оставить без изменений.
Если у вас возникли проблемы с загрузкой CSV-файла в PractiTest, убедитесь, что CSV-файл сохранен в текущей кодировке (UTF-8). Это особенно важно для неанглийских символов.
Известно, что MS-Excel сохраняет файлы CSV в различных стандартах кодирования в зависимости от операционной системы компьютера, на котором он установлен. По этой причине рекомендуется сохранять CSV-файлы с помощью других программ, которые гарантируют, что для файла установлена правильная кодировка:
Сохранение в формате UTF-8 с помощью Open Office
- Откройте файл (если есть возможность, откройте его как файл UTF-8)
- Файл -> Сохранить как…
- Тип файла -> Выбрать текстовый CSV
- Набор символов -> выберите «Юникод (UTF-8)»
- Разделитель полей -> , (запятая)
Сохранение в формате UTF-8 в Документах Google
- Для начала загрузите файл в Документы Google. Откройте меню «Загрузить» (1) в своей учетной записи Google Docs и выберите «Файлы» в раскрывающемся меню.
- Выберите файл, который хотите загрузить. откроется окно настроек загрузки.
- Убедитесь, что выбран первый вариант ("преобразование документов, презентаций, электронных таблиц и рисунков в соответствующий формат Документов Google"), и нажмите "Начать загрузку".
- После загрузки дважды щелкните файл, чтобы открыть его в новом окне.
- Перейдите в меню «Файл» -> «Загрузить как» и выберите CSV (обратите внимание, что формат CSV не поддерживает несколько листов в Excel).
Загруженный файл будет сохранен в формате UTF-8 и будет правильно отображаться при загрузке в PractiTest.
Читайте также: