Как сохранить CSV в utf 8 из Excel
Обновлено: 07.07.2024
В статье рассматриваются быстрые и эффективные способы экспорта данных из Excel в CSV с сохранением всех специальных символов и иностранных символов. Методы работают для всех версий Excel, от 365 до 2007.
Значения, разделенные запятыми (CSV), – это широко используемый формат, в котором табличные данные (числа и текст) хранятся в виде обычного текста. Его популярность и жизнеспособность обусловлены тем, что файлы CSV поддерживаются многими различными приложениями и системами, по крайней мере, в качестве альтернативного формата импорта/экспорта. Формат CSV позволяет пользователям взглянуть на файл и сразу диагностировать проблемы с данными, изменить разделитель, квалификатор текста и т. д. Все это возможно, потому что документ CSV представляет собой обычный текст, и его может легко понять обычный пользователь или даже новичок. без обучения.
Форматы CSV, поддерживаемые Excel
Microsoft Excel позволяет сохранять файл в нескольких различных форматах CSV, и вам может быть интересно узнать о различиях между ними.
По сути, каждый формат CSV сохраняет данные в виде значений, разделенных запятыми, но кодирует их немного по-разному. Например, Mac использует один символ возврата каретки ( ), представленный \r для разрыва строки, а Windows использует комбинацию возврата каретки и перевода строки ( ), представленную \r\n.
Чтобы правильно экспортировать данные в другие программы, Excel позволяет выбрать формат CSV, который лучше всего соответствует ожиданиям программы.
Вот параметры CSV, доступные в Excel 365. В вашей версии список может выглядеть немного иначе.
CSV (с разделителями-запятыми). В этом формате данные сохраняются в текстовом файле с разделителями-запятыми, который можно использовать в другой программе Windows или другой версии операционной системы Windows.
CSV (для Macintosh). В этом формате рабочая книга сохраняется в виде файла с разделителями-запятыми для использования в операционной системе Mac.
CSV (MS-DOS). Сохраняет как документ с разделителями-запятыми для использования в операционной системе MS-DOS.
Помимо CSV, есть еще один формат, который может оказаться очень удобным для связи с другими программами.
Текст Unicode (*.txt). Это стандарт компьютерной индустрии, поддерживаемый почти всеми современными операционными системами, включая Windows, Macintosh, Linux и Solaris Unix. Он может обрабатывать символы почти всех современных языков и некоторых древних языков.
Примечание. По строгому определению формат CSV подразумевает разделение значений запятыми. На самом деле вы можете встретить много других разделителей, чаще всего это точка с запятой и табуляция.
Как преобразовать файл Excel в CSV
Если данные Excel необходимо перенести в другое приложение, например в адресную книгу Outlook или базу данных Access, проще всего сохранить рабочий лист в виде файла .csv, а затем импортировать этот файл в другую программу.
Чтобы сохранить файл Excel (.xlsx или .xls) в формате CSV, выполните следующие действия:
Если на вашем листе есть какое-либо форматирование, формулы, диаграммы, фигуры или другие объекты, вы будете проинформированы о том, что некоторые функции в вашей книге могут быть потеряны, если вы сохраните ее в формате CSV (с разделителями-запятыми). Если все в порядке, нажмите Да, чтобы завершить преобразование без неподдерживаемых функций.
Экспорт Excel в CSV без уничтожения специальных символов
Если ваша электронная таблица содержит специальные символы, умные кавычки или длинные тире (например, унаследованные от документа Word), иностранные символы (тильды, диакритические знаки и т. д.) или иероглифы, описанный выше метод не сработает.
Дело в том, что сохранение в формате CSV (с разделителями-запятыми) искажает любые символы, кроме ASCII (американский стандартный код для обмена информацией).
Прежде чем мы перейдем к этапам экспорта, давайте укажем на ключевые особенности каждой кодировки, чтобы вы могли выбрать формат, подходящий для конкретного случая.
UTF-8 – более компактная кодировка, поскольку в ней для каждого символа используется от 1 до 4 байтов. Как правило, этот формат рекомендуется, если символы ASCII преобладают в вашем файле, поскольку большинство таких символов хранятся в одном байте каждый. Еще одним преимуществом является то, что файл UTF-8, содержащий только символы ASCII, имеет абсолютно ту же кодировку, что и файл ASCII.
UTF-16 использует от 2 до 4 байтов для кодирования каждого символа. Однако для файла UTF-16 не всегда требуется больше памяти, чем для файла UTF-8. Например, японские символы занимают от 3 до 4 байтов в UTF-8 и от 2 до 4 байтов в UTF-16. Таким образом, вы можете захотеть использовать UTF-16, если ваши данные содержат какие-либо азиатские символы, включая японские, китайские или корейские.Заметным недостатком этого формата является то, что он не полностью совместим с файлами ASCII и требует, чтобы некоторые программы, поддерживающие Unicode, отображали их. Имейте это в виду, если вы собираетесь импортировать полученный документ куда-то за пределы Excel.
После того как вы определились с форматом, приведенные ниже инструкции помогут вам в этом.
Как конвертировать Excel в CSV UTF-8
Предположим, у вас есть рабочий лист с некоторыми иностранными символами, в нашем случае японскими именами:
В зависимости от используемой вами версии Excel может потребоваться от 3 до 5 шагов, чтобы преобразовать этот файл в CSV с сохранением всех специальных символов.
Экспорт в CSV UTF-8 в Excel 2016–365
В Excel 2016 и более поздних версиях вы можете напрямую сохранить файл в формате CSV с кодировкой UTF-8:
Преобразование в CSV UTF-8 в Excel 2013–2007
Поскольку старые версии Excel не поддерживают кодировку UTF-8, вам необходимо сначала сохранить документ в текстовом формате Unicode, а затем преобразовать его в UTF-8.
Чтобы экспортировать файл Excel в CSV и сохранить специальные символы, выполните следующие действия:
Примечание. Некоторые простые текстовые редакторы не полностью поддерживают все символы Unicode, поэтому некоторые символы могут отображаться в виде прямоугольников. В большинстве случаев это не повлияет на результирующий файл, поэтому вы можете просто игнорировать это или использовать более продвинутый текстовый редактор, такой как Notepad++.
-
Выберите любой символ табуляции, щелкните его правой кнопкой мыши и выберите «Копировать» в контекстном меню или нажмите комбинацию клавиш Ctrl + C.
Если вам нужен CSV-файл, разделенный точкой с запятой, замените табуляцию точкой с запятой.
Если все сделано правильно, итоговый файл txt должен выглядеть примерно так:
- В поле Имя файла измените расширение .txt на .csv.
- В поле Тип файла выберите Все файлы (*.*).
- В раскрывающемся меню Кодировка выберите UTF-8 со спецификацией.
По завершении нажмите кнопку Сохранить.
- Знак порядка байтов (BOM) представляет собой последовательность байтов в начале текстового потока, указывающую на кодировку Unicode текстового документа. В случае UTF-8 с BOM последовательность 0xEF,0xBB,0xBF сигнализирует программе чтения, что в файле используется кодировка UTF-8. Стандарт Unicode разрешает, но не требует спецификации в UTF-8. Однако часто это имеет решающее значение для правильного распознавания UTF-8 в Excel, особенно при преобразовании из азиатских языков.
- Если ваш текстовый редактор не позволяет изменить расширение файла, вы можете сделать это в проводнике Windows.
Теперь вы можете открыть CSV-файл в Excel и убедиться, что все данные отображаются правильно:
Примечание. Если ваш файл предназначен для использования в другом приложении, где формат UTF-8 является обязательным, не вносите никаких изменений и не сохраняйте файл в Excel, так как это может вызвать проблемы с кодировкой. Если какие-то данные не отображаются прямо в Excel, откройте файл в Блокноте и исправьте там данные. Не забудьте снова сохранить файл в формате UTF-8 с BOM.
Как конвертировать файл Excel в CSV UTF-16
Экспорт в CSV UTF-16 выполняется почти так же, как и в CSV UTF-8:
- Сохраните книгу в текстовом формате Unicode (*.txt).
- Откройте документ .txt в текстовом редакторе, например в Блокноте, и замените все табуляции запятыми.
- Измените расширение файла на .csv, убедитесь, что установлена кодировка UTF-16 LE, и сохраните файл.
Преобразование нескольких листов Excel в CSV
Как уже упоминалось, команда Excel Сохранить как может преобразовать только активный рабочий лист. Но что, если ваша книга содержит много разных листов, и вы хотите превратить их все в отдельные CSV-файлы? Единственная альтернатива, предложенная Microsoft, — это сохранение каждого листа под другим именем файла, что звучит не очень вдохновляюще, не так ли?
Итак, есть ли быстрый способ сохранить сразу несколько листов Excel в формате CSV? Да, это можно сделать с помощью VBA.
Приведенный ниже код преобразует все рабочие листы в текущей книге в отдельные файлы CSV, по одному для каждого листа. Имена файлов создаются из имен книг и листов (WorkbookName_SheetName.csv) и сохраняются в той же папке, что и исходный документ.
Имейте в виду, что приведенный выше код сохраняет листы в формате CSV. Если в ваших данных есть символы, отличные от ASCII, вам необходимо преобразовать их в UTF-8 CSV. Это можно сделать, изменив формат файла с xlCSV на xlCSVUTF8. То есть вы заменяете FileFormat:=xlCSV на FileFormat:=xlCSVUTF8.
Кроме того, помните, что преобразования CSV UTF-8 возможны в Excel 2016 и более поздних версиях.
Следующие рекомендации помогут вам добавить макрос в книгу: Как вставить и запустить код VBA в Excel.
Помимо методов, описанных выше, существует несколько других способов преобразования листов Excel в формат CVS. Ниже я поделюсь парой моих любимых.
Из Excel в CSV с помощью таблиц Google
Использование таблиц Google для преобразования .xlsx в .csv кажется очень простым решением:
Совет. Если у вас относительно небольшой набор данных, может быть проще скопировать/вставить его непосредственно в электронную таблицу.
Откройте загруженный файл в любом текстовом редакторе, чтобы убедиться, что все данные экспортированы правильно.
Примечание. Если ваш исходный лист Excel содержит специальные символы, полученный CSV-файл может неправильно отображать символы при открытии в Excel, хотя во многих других программах для работы с электронными таблицами он выглядит идеально.
Сохраните .xlsx в .xls, а затем преобразуйте в .csv
Этот метод преобразования Excel в CSV вряд ли нуждается в дополнительных пояснениях, потому что в заголовке все сказано :)
Я наткнулся на это решение на каком-то форуме, не помню на каком именно. Честно говоря, у меня этот метод никогда не работал, но многие пользователи сообщали, что специальные символы, которые терялись при сохранении .xlsx напрямую в .csv, сохраняются, если сначала сохранить файл .xlsx в .xls, а затем сохранить .xls как .csv, как описано в разделе Как преобразовать Excel в CSV.
В любом случае вы можете попробовать этот метод экспорта Excel в CSV на своей стороне, и если он сработает, это может реально сэкономить время.
Преобразование Excel в CSV с помощью OpenOffice
OpenOffice – это набор из шести приложений с открытым исходным кодом. Одним из них является приложение для работы с электронными таблицами под названием Calc, которое отлично подходит для экспорта данных электронных таблиц в формат CSV. На самом деле он предоставляет больше возможностей (кодировки, разделители и т. д.), чем Microsoft Excel и Google Таблицы вместе взятые.
Чтобы преобразовать файл Excel в CSV, выполните следующие действия:
- Откройте документ Excel с помощью OpenOffice Calc.
- Нажмите Файл > Сохранить как… и выберите текстовый файл CSV (.csv) в раскрывающемся меню Тип файла.
- Далее вам будет предложено определить кодировку и разделители. Если вашей целью является формат CVS, который правильно обрабатывает специальные символы, выберите:
- Юникод (UTF-8) для набора символов.
- Запятая для разделителя полей. Если вам нужен CSV-файл, разделенный точкой с запятой, выберите точку с запятой (;) или любой другой разделитель.
- Кавычки для разделителя текста.
Чтобы завершить преобразование, нажмите ОК.
Было бы здорово, если бы Excel предоставлял аналогичные возможности для быстрого и безболезненного преобразования CSV, не так ли?
Это известные мне способы преобразования Excel в CSV. Если вы знаете другие более эффективные методы, поделитесь ими в комментариях. Спасибо за прочтение!
Вас также может заинтересовать
69 комментариев к статье "Как конвертировать файлы Excel в CSV (с разделителями-запятыми) и CSV UTF-8"
Я ищу простой способ просто экспортировать текущий лист в csv, но сохранить мою книгу xlsx нетронутой. Я часто сохраняю как csv и забываю сохранить свою книгу как xlsx и потерять всю свою работу. Я пропустил более простой способ?
большое спасибо
Я сохранил лист Excel в формате CSV, чтобы экспортировать его, но когда я импортирую его в программное обеспечение моей компании, он добавляет '' перед первой ячейкой в каждой строке. Это вызывает проблемы.
Этого не было, когда я делал то же самое с Excel 2007. Эта проблема началась только при обновлении до Excel 2010.
Есть идеи, как мне избавиться от этого ''?
У меня есть 1500 файлов Excel, если я изменяю один за другим, для преобразования требуется 3 дня, я ищу преобразование одновременно. Пожалуйста, помогите мне.
Спасибо,
Ачинтья Мондал
Привет, я столкнулся с проблемой при создании отправки, даже я даю 6-10 буквенно-цифровых символов, но не принимаю, что делать?? помогите мне
Привет!
Большое спасибо за это - после борьбы просто "сохранить как csv". возможность преобразования xlsx в xls в csv. помогло, когда я пытался импортировать базу данных адресов электронной почты в GMAIL. Какое облегчение! СПАСИБО!!
Здравствуйте, IAM столкнулся с проблемой при сохранении файла в формате csv, он говорит, что некоторые функции будут потеряны, и да, после загрузки данных в среду weka IAM получает только 1 функцию из 41 функции. если кто-то может помочь, пожалуйста.
Уважаемые господа/госпожа,
Когда я пытаюсь сохранить как excel в csv, пункт №. 5 не появилось:
"При нажатии кнопки "ОК" в первом диалоговом окне отобразится второе сообщение, информирующее вас о том, что ваш рабочий лист может содержать функции, не поддерживаемые кодировкой CSV. Это нормально, поэтому просто нажмите "Да".
Ваша помощь очень ценна
Здравствуйте,
У меня возникла проблема, когда я пытаюсь преобразовать электронную таблицу Excel в CSV, и ячейка, содержащая текст в кавычках, например "Здравствуйте", всегда преобразуется как """Здравствуйте""" в файле CSV. У меня заканчиваются идеи, не могли бы вы помочь мне найти способ сохранить данные без изменений, спасибо. Антеро
Значения, разделенные запятыми (CSV), – это полезная функция, наглядно используемая для сохранения табличных данных в простом текстовом формате. Они имеют значение в мире приложений и программирования для наилучшего использования данных путем импорта или экспорта данных из файлов Excel. Формат CSV помогает пользователям быстро просматривать данные и при необходимости вносить исправления. Изменения, такие как заключение значений в кавычки и разделитель, вносятся легко.
Это возможно, потому что данные представлены в простом формате, легко понятном новому пользователю, не имеющему большого опыта работы с ним. Представленная ниже информация помогает на примерах понять процесс преобразования данных Excel в CSV без повреждения символов и специальных символов.
Как конвертировать Excel в CSV?
Вот примеры преобразования Excel в файл CSV.
В этом примере показано преобразование простого листа Excel в формат CSV
-
На первом этапе перейдите к кнопке Microsoft Office (версия 2007 г.) или вкладке «Файл» (версия 2013 г.) и выберите параметр «Сохранить как» или нажмите клавишу F12, чтобы отобразить диалоговое окно «Сохранить как».
Этот пример иллюстрирует формат Excel CSV UTF-8 Excel CSV UTF-8. В случае, если Excel содержит какие-либо умные кавычки или любые другие языковые данные при преобразовании данных из Excel в CSV, он не будет точно преобразован и в конечном итоге получит вопросительные знаки. . Используя Excel CSV UTF8 в качестве кодировки, мы можем легко выбрать формат файла и язык. читать больше с CSV. Если лист Excel содержит специальные символы и данные на других языках, они не отображаются должным образом. Для правильного отображения файл Excel преобразуется с использованием кодировки UTF-8, как показано на рисунке.
- Во-первых, лист Excel необходимо преобразовать в текстовый формат Unicode, используя тот же тип, что и .txt. Это приводит к пробелу между данными в строке.
- Пространство табуляции заменяется запятыми, преобразующими данные в файл с разделителями-запятыми.
- На этом этапе формат файла .txt преобразуется в CSV с помощью параметра «Сохранить как» или изменения имени файла Excel с расширением .csv.
Преобразовать Excel в CSV очень просто, так как кодировка UTF-16 выполняется в два этапа.
Электронные таблицы Google помогают преобразовывать данные в формат CSV через Интернет, выполнив пять шагов.
Объяснение преобразования Excel в файл CSV
Пользователь должен использовать любую доступную технологию для преобразования листа Excel в формат CSV.При открытии или преобразовании файлов CSV и внесении изменений в форматы требуется правильная обработка предупреждений и сообщений безопасности. Данные, представленные на любом языке, легко конвертировать с помощью UTF-8.
Прежде всего необходимо преобразовать данные в текстовый формат, изменив формат файла на .txt. Данные отображаются, как показано ниже.
Данные следует преобразовать в формат с разделителями-запятыми, заменив пробел запятой. После этого формат файла следует сохранить в .CSV из текстового формата.
Как использовать файлы CSV?
Файлы CSV используются Data Scientist для визуализации табличных данных. Они легко извлекаются в различные приложения при создании баз данных в Excel Создание баз данных в Excel Когда мы вводим данные в Excel в виде таблиц со строками и столбцами и даем каждой таблице имя, мы создаем базу данных. читать больше и таблицы. Существует два способа использования CSV-файлов веб-разработчиком, в том числе
- Легко импортировать в базы данных независимо от программного обеспечения, используемого для разработки веб-сайта.
- Улучшение управления большими объемами данных возможно благодаря тому, что данные представлены в текстовом формате без каких-либо формул.
Для эффективного использования CSV-файлов необходимо импортировать их в такие приложения, как базы данных, и преобразовывать их в таблицы для дальнейшего анализа данных. Это упрощает принятие точных решений.
Например, когда мы импортировали данные о клиентах в таблицу Excel, адреса клиентов находятся в разных столбцах, и для копирования данных из разных ячеек требуется время. CSV помогает лучше справиться с этой ситуацией, разделяя данные запятыми.
Что следует помнить при преобразовании Excel в CSV
Для успешного преобразования файлов Excel в CSV необходимо помнить следующее.
- Необходимо правильно выбрать различные форматы CSV, доступные на листе Excel, например CSV для Macintosh, CSV для MS-DOS и текст Unicode. Соответствующий формат следует выбирать в зависимости от требований пользователя.
- Единовременно только один активный лист книги Excel преобразуется в формат CSV.
- При импорте данных в приложение для обработки текста пробел следует заменить запятой, чтобы успешно преобразовать его в значения, разделенные запятыми.
- Пользователь может использовать бесплатные инструменты, доступные в Интернете, для преобразования листа Excel в формат CSV без особых усилий.
- Невозможно преобразовать все листы книги Excel одновременно.
Рекомендуемые статьи
Это руководство по преобразованию файлов Excel в CSV. Здесь мы обсуждаем, как преобразовать Excel в файл CSV, а также практические примеры и загружаемый шаблон Excel. Вы можете узнать больше об Excel из следующих статей –
Часто почти невозможно узнать, был ли ваш CSV-файл закодирован как UTF-8. Программы не могут сказать вам наверняка, потому что в файле, содержащем эту информацию, нет настройки. Ближе всего к определению кодировки файла можно предположить или спросить человека, создавшего файл. Обычно человек, создающий файл, тоже не знает. Тогда все потеряно? Не совсем, вы можете создать свой собственный файл и сохранить его с известной кодировкой.
Выбор электронной таблицы в этом случае — OpenOffice или LibreOffice. Если вы используете Excel для выполнения всей своей работы, вам не повезло, поскольку в Excel нет возможности принудительно использовать кодировку при сохранении файла в формате CSV. Это не означает, что вы больше не можете использовать Excel, но при сохранении файла в формате CSV откройте файл Excel с помощью OpenOffice или LibreOffice.
Запустите OpenOffice/LibreOffice
В этом примере я буду использовать LibreOffice (экраны те же, что и для OpenOffice).
Открыть файл
Нажмите «Открыть» и выберите файл на своем компьютере, который вы хотите сохранить как файл в кодировке UTF-8.
Сохраните файл
Мы не собираемся использовать CTRL-S для быстрого сохранения файла, но мы выбираем «Файл» -> «Сохранить как» (CTRL-SHIFT-S), после чего вы получаете этот экран:
Есть несколько важных моментов:
- Назовите файл
- Тип файла должен быть "Текст CSV" (.csv).
- Необходимо включить Изменить настройки фильтра.
После этого нажмите Сохранить.
Настройка параметров фильтра
После того, как вы нажали «Сохранить», LibreOffice спросит вас, какие настройки вы хотите использовать для файла.
< бр />р>
Набор символов должен быть установлен в Unicode (UTF-8), так как это то, что мы хотим получить, файл в кодировке UTF-8.
Поле и текстовый разделитель вы можете установить по своему усмотрению или оставить как есть, все остальные настройки можно оставить без изменений.
Если у вас возникли проблемы с загрузкой CSV-файла в PractiTest, убедитесь, что CSV-файл сохранен в текущей кодировке (UTF-8). Это особенно важно для неанглийских символов.
Известно, что MS-Excel сохраняет файлы CSV в различных стандартах кодирования в зависимости от операционной системы компьютера, на котором он установлен. По этой причине рекомендуется сохранять CSV-файлы с помощью других программ, которые гарантируют, что для файла установлена правильная кодировка:
Сохранение в формате UTF-8 с помощью Open Office
- Откройте файл (если есть возможность, откройте его как файл UTF-8)
- Файл -> Сохранить как…
- Тип файла -> Выбрать текстовый CSV
- Набор символов -> выберите «Юникод (UTF-8)»
- Разделитель полей -> , (запятая)
Сохранение в формате UTF-8 в Документах Google
- Для начала загрузите файл в Документы Google. Откройте меню «Загрузить» (1) в своей учетной записи Google Docs и выберите «Файлы» в раскрывающемся меню.
- Выберите файл, который хотите загрузить. откроется окно настроек загрузки.
- Убедитесь, что выбран первый вариант ("преобразование документов, презентаций, электронных таблиц и рисунков в соответствующий формат Документов Google"), и нажмите "Начать загрузку".
- После загрузки дважды щелкните файл, чтобы открыть его в новом окне.
- Перейдите в меню «Файл» -> «Загрузить как» и выберите CSV (обратите внимание, что формат CSV не поддерживает несколько листов в Excel).
Загруженный файл будет сохранен в формате UTF-8 и будет правильно отображаться при загрузке в PractiTest.
Читайте также: