Как загрузить CSV-файл

Обновлено: 21.11.2024

Не знаете, почему ваш CSV-файл загружается неправильно? К сожалению, проблем может быть сколько угодно.

Хорошей новостью является то, что большинство ошибок импорта данных CSV можно разделить на несколько категорий: например, несоответствие заголовков или неожиданные значения. В этом посте мы расскажем о процессе импорта CSV, структуре данных файла и распространенных проблемах, чтобы помочь вам устранить неполадки при импорте.

Причины, по которым может произойти сбой при импорте CSV

Импорт данных имеет решающее значение для эффективного использования программного обеспечения. Как вы можете использовать программное обеспечение для электронного маркетинга без контактов с клиентами? Вы не можете.

Но импорт CSV-файла не всегда проходит гладко.

Чтобы узнать, почему ваш CSV-файл неправильно загружается в используемое вами программное обеспечение, сначала нужно понять структуру CSV-файла.

Разбивка CSV-файла на части базовой структуры данных облегчит выявление проблемы.

Структура CSV-файла

Файл CSV представляет собой файл со значениями, разделенными запятыми. Это означает, что файл использует запятые для разделения различных значений. Программа для работы с электронными таблицами помещает эти значения в ячейки в столбцах и строках, но когда мы смотрим на то, что происходит за кулисами, то, что мы видим в ячейках, на самом деле разделяется запятыми.

Подходящее руководство по формату CSV зависит от программного обеспечения, в которое вы загружаете файл, поэтому ознакомьтесь с его документацией. Если вы не можете найти руководство по формату CSV, обратитесь в службу поддержки клиентов. Скорее всего, у них уже есть статья службы поддержки, в которой рассказывается о требованиях и шагах для загрузки, таких как размер файла или тип значения (числа, денежное выражение, месяцы и т. д.)

Распространенные проблемы с импортом CSV (и способы их устранения)

Размер файла слишком велик. Инструмент импорта CSV в используемой вами программе может иметь требования к размеру файла. Чтобы уменьшить размер файла, вы можете удалить ненужные значения данных, столбцы и строки.

Проблемы сопоставления. Хороший импортер данных должен упростить пользователям сопоставление заголовков в их CSV-файле с тем, что ожидает программа, но многие импортеры данных не способны справиться с этим должным образом. Чтобы добиться успеха, вам может потребоваться переименовать строки заголовков в ожидаемые и повторить попытку. Другие проблемы с сопоставлением могут возникнуть, если ожидаемые столбцы расположены в неправильном порядке или отсутствуют некоторые обязательные поля.

Ошибки преобразования данных. Преобразование данных, по сути, извлекает данные из CSV в то, что может использовать программа. Если есть нестандартные символы или если данные закодированы, перевод данных (и весь импорт) может завершиться ошибкой. Чтобы это исправить, обратите внимание на любые сообщения об ошибках, в которых говорится о наличии нестандартных символов, и удалите их из файла.

Проблемы со значением данных. Инструмент импорта CSV обычно ожидает определенного типа значения данных. Если вы ввели дату вместо суммы в долларах, загрузка CSV может завершиться ошибкой. Проверьте всю документацию поддержки по ожидаемым значениям и отредактируйте файл CSV соответствующим образом.

Отсутствуют данные. Для работы импорта могут потребоваться определенные наборы данных. Например, если вы загружаете список продуктов в систему управления запасами, но у вас нет столбца для SKU, это может быть ошибкой. Ознакомьтесь с сообщениями об ошибках и документами поддержки, чтобы выяснить, какие данные требуются.

Неперевариваемые форматы. Это просто означает, что данные могут быть в неправильном формате. Например, предположим, что у вас есть телефонные номера в столбце вашего CSV-файла в формате 5555555555, но ваш импортер CSV требует, чтобы формат был (555)555-5555. Вам нужно будет отредактировать все экземпляры и повторить попытку импорта CSV.

Решение этих распространенных проблем устранит большинство ошибок импорта CSV, поэтому попробуйте их и отредактируйте соответствующие ошибки Microsoft Excel из своего файла. Если вы не уверены, в чем проблема (отсутствует сообщение об ошибке и вы не можете найти конкретную информацию в справочном центре программного обеспечения), обратитесь в службу поддержки за инструкциями по исправлению ошибок.

А если вы являетесь частью команды разработчиков и хотите автоматически решать эти проблемы с импортом для клиентов, рассмотрите возможность использования встроенного средства импорта данных, чтобы улучшить процесс загрузки данных.

Часто задаваемые вопросы о загрузке CSV-файлов

Помимо устранения распространенных ошибок, у вас могут возникнуть и другие проблемы с CSV-файлами. Вот несколько ответов на часто задаваемые вопросы:

Какие символы нельзя использовать в файле CSV?

Ответ на этот вопрос зависит от программы, в которую вы загружаете данные. Например, QuickBooks не позволяет использовать нули, символы доллара или запятые в файлах. В целом не рекомендуется использовать такие символы, как косая черта, амперсанд и запятая.

В чем разница между текстовым файлом и файлом CSV?

Типы файлов могут сбивать с толку. Текстовый файл не так оптимизирован, как файл CSV для программы электронных таблиц, поэтому не рекомендуется загружать или выгружать данные с помощью файла TXT.Со значениями, разделенными запятыми, CSV – более безопасный вариант.

Почему CSV не сохраняет форматирование?

Файлы CSV не могут сохранять какое-либо форматирование, поэтому, если вы хотите создать стилизованные заголовки, вместо этого вам нужно использовать Excel. Однако этот тип файла не рекомендуется для импорта данных.

Как восстановить поврежденный CSV-файл?

Чтобы восстановить поврежденный CSV-файл, убедитесь, что он сохранен в кодировке UTF-8. Вам также может потребоваться удалить специальные символы, такие как точки с запятой и запятые, из-за которых ячейки данных ошибочно разделяются на две части.

Что такое квалификатор текста в CSV?

Определитель текста — это способ сообщить Excel, что значения должны находиться в отдельных ячейках. Возможно, вы видели двойные кавычки, когда щелкаете ячейку для ее редактирования, но тогда эти кавычки не отображаются в программе для работы с электронными таблицами. Эти текстовые квалификаторы не должны создавать проблем при загрузке, но при необходимости их можно удалить.

Какой длины может быть файл CSV и сколько записей он может содержать?

Как формат файла, CSV не имеет особых ограничений. Вместо этого ограничения возникают из-за того, какую программу для работы с электронными таблицами вы используете. Максимальное количество строк для файла Excel составляет 1 048 576 строк, а максимальное количество столбцов — 16 384. Вероятность того, что ваш CSV-файл не загружается из-за слишком большого количества строк или столбцов в файле, очень мала, но это может случиться.

Подводя итог, можно сказать, что существует множество причин, по которым CSV-файл может не импортироваться успешно. Если ваш бизнес зависит от того, что клиенты импортируют свои собственные файлы, вы можете заметить, что многие клиенты проживают в бедном городе. Если пользователи программного обеспечения не могут импортировать свои данные, они не могут использовать настоящий продукт и получать от него результаты. Убедитесь, что вы оптимизируете процесс загрузки данных, который включает в себя желаемый опыт импорта CSV для ваших клиентов.

Есть два способа импортировать данные из текстового файла в Excel: вы можете открыть его в Excel или импортировать как диапазон внешних данных. Чтобы экспортировать данные из Excel в текстовый файл, используйте команду «Сохранить как» и измените тип файла в раскрывающемся меню.

Существует два широко используемых формата текстовых файлов:

Текстовые файлы с разделителями (.txt), в которых символ TAB (код символа ASCII 009) обычно разделяет каждое поле текста.

Текстовые файлы значений, разделенных запятыми (.csv), в которых символ запятой (,) обычно разделяет каждое поле текста.

Вы можете изменить символ-разделитель, который используется как в текстовых файлах с разделителями, так и в текстовых файлах .csv. Это может быть необходимо, чтобы убедиться, что операция импорта или экспорта работает так, как вы хотите.

Примечание. Вы можете импортировать или экспортировать до 1 048 576 строк и 16 384 столбцов.

Импортируйте текстовый файл, открыв его в Excel

Текстовый файл, созданный в другой программе, можно открыть как книгу Excel с помощью команды "Открыть". Открытие текстового файла в Excel не меняет формат файла — вы можете увидеть это в строке заголовка Excel, где имя файла сохраняет расширение имени текстового файла (например, .txt или .csv).

Выберите «Файл» > «Открыть» и перейдите в папку, содержащую текстовый файл.

Выберите «Текстовые файлы» в раскрывающемся списке типов файлов в диалоговом окне «Открыть».

Найдите текстовый файл, который хотите открыть, и дважды щелкните его.

Если это текстовый файл (.txt), Excel запускает мастер импорта текста. Когда вы закончите с шагами, нажмите «Готово», чтобы завершить операцию импорта. Дополнительную информацию о разделителях и дополнительных параметрах см. в Мастере импорта текста.

Если файл имеет формат .csv, Excel автоматически открывает текстовый файл и отображает данные в новой книге.

Примечание. Когда Excel открывает CSV-файл, он использует текущие настройки формата данных по умолчанию для интерпретации того, как импортировать каждый столбец данных. Если вам нужна большая гибкость при преобразовании столбцов в другие форматы данных, вы можете использовать Мастер импорта текста. Например, формат столбца данных в CSV-файле может быть MDY, но формат данных Excel по умолчанию — YMD, или вы хотите преобразовать столбец чисел, содержащий начальные нули, в текст, чтобы сохранить начальные нули. Чтобы заставить Excel запустить мастер импорта текста, вы можете изменить расширение имени файла с .csv на .txt, прежде чем открывать его, или вы можете импортировать текстовый файл, подключившись к нему (дополнительные сведения см. в следующем разделе).

Импортировать текстовый файл, подключившись к нему (Power Query)

Вы можете импортировать данные из текстового файла в существующий лист.

На вкладке "Данные" в группе "Получить и преобразовать данные" нажмите "Из текста/CSV".

В диалоговом окне "Импорт данных" найдите и дважды щелкните текстовый файл, который нужно импортировать, и нажмите "Импорт".

В диалоговом окне предварительного просмотра у вас есть несколько вариантов:

Выберите Загрузить, если вы хотите загрузить данные непосредственно на новый лист.

Кроме того, выберите Загрузить в, если вы хотите загрузить данные в таблицу, сводную таблицу/сводную диаграмму, существующий/новый лист Excel или просто создать подключение. Вы также можете добавить свои данные в модель данных.

Выберите «Преобразовать данные», если вы хотите загрузить данные в Power Query и отредактировать их перед переносом в Excel.

Если Excel не преобразует определенный столбец данных в нужный формат, вы можете преобразовать данные после их импорта. Дополнительные сведения см. в разделах Преобразование чисел, сохраненных в виде текста, в числа и Преобразование дат, сохраненных в виде текста, в даты.

Экспортировать данные в текстовый файл, сохранив его

Вы можете преобразовать рабочий лист Excel в текстовый файл с помощью команды "Сохранить как".

Выберите «Файл» > «Сохранить как».

Нажмите "Обзор".

В диалоговом окне "Сохранить как" в поле "Тип файла" выберите формат текстового файла для рабочего листа; например, нажмите «Текст» (с разделителями табуляции) или «CSV» (с разделителями-запятыми).

Примечание. Различные форматы поддерживают разные наборы функций. Дополнительные сведения о наборах функций, поддерживаемых различными форматами текстовых файлов, см. в разделе Форматы файлов, поддерживаемые в Excel.

Перейдите к месту, где вы хотите сохранить новый текстовый файл, и нажмите "Сохранить".

Появится диалоговое окно с напоминанием о том, что в новый файл будет сохранен только текущий рабочий лист. Если вы уверены, что текущий рабочий лист — это тот, который вы хотите сохранить в виде текстового файла, нажмите «ОК». Вы можете сохранить другие рабочие листы как отдельные текстовые файлы, повторив эту процедуру для каждого рабочего листа.

Вы также можете увидеть предупреждение под лентой о том, что некоторые функции могут быть потеряны, если вы сохраните книгу в формате CSV.

Дополнительную информацию о сохранении файлов в других форматах см. в разделе Сохранение книги в другом формате файла.

Импортировать текстовый файл, подключившись к нему

Вы можете импортировать данные из текстового файла в существующий лист.

Нажмите на ячейку, в которую вы хотите поместить данные из текстового файла.

На вкладке "Данные" в группе "Получить внешние данные" нажмите "Из текста".

В диалоговом окне "Импорт данных" найдите и дважды щелкните текстовый файл, который нужно импортировать, и нажмите "Импорт".

Следуйте инструкциям мастера импорта текста. Нажмите «Справка» на любой странице мастера импорта текста, чтобы получить дополнительные сведения об использовании мастера. Когда вы закончите шаги мастера, нажмите Готово, чтобы завершить операцию импорта.

В диалоговом окне "Импорт данных" выполните следующие действия:

В разделе Куда вы хотите поместить данные? выполните одно из следующих действий:

Чтобы вернуть данные в выбранное место, щелкните Существующий лист.

Чтобы вернуть данные в левый верхний угол нового рабочего листа, нажмите "Новый рабочий лист".

При необходимости нажмите "Свойства", чтобы установить параметры обновления, форматирования и макета для импортированных данных.

Excel помещает диапазон внешних данных в указанное вами место.

Если Excel не преобразует столбец данных в нужный формат, вы можете преобразовать данные после их импорта. Дополнительные сведения см. в разделах Преобразование чисел, сохраненных в виде текста, в числа и Преобразование дат, сохраненных в виде текста, в даты.

Экспортировать данные в текстовый файл, сохранив его

Вы можете преобразовать рабочий лист Excel в текстовый файл с помощью команды "Сохранить как".

Выберите «Файл» > «Сохранить как».

Появится диалоговое окно "Сохранить как".

В поле "Тип файла" выберите формат текстового файла для листа.

Например, нажмите Текст (с разделителями табуляции) или CSV (с разделителями-запятыми).

Примечание. Различные форматы поддерживают разные наборы функций. Дополнительные сведения о наборах функций, поддерживаемых различными форматами текстовых файлов, см. в разделе Форматы файлов, поддерживаемые в Excel.

Перейдите к месту, где вы хотите сохранить новый текстовый файл, и нажмите "Сохранить".

Появится диалоговое окно с напоминанием о том, что в новый файл будет сохранен только текущий рабочий лист. Если вы уверены, что текущий рабочий лист — это тот, который вы хотите сохранить в виде текстового файла, нажмите «ОК». Вы можете сохранить другие рабочие листы как отдельные текстовые файлы, повторив эту процедуру для каждого рабочего листа.

Появится второе диалоговое окно с напоминанием о том, что ваш рабочий лист может содержать функции, не поддерживаемые форматами текстовых файлов. Если вас интересует только сохранение данных рабочего листа в новый текстовый файл, нажмите «Да». Если вы не уверены и хотели бы узнать больше о том, какие функции Excel не поддерживаются форматами текстовых файлов, нажмите «Справка», чтобы получить дополнительную информацию.

Дополнительную информацию о сохранении файлов в других форматах см. в разделе Сохранение книги в другом формате файла.

Способ изменения разделителя при импорте зависит от того, как вы импортируете текст.

Если вы используете «Получить и преобразовать данные» > «Из текста/CSV», после выбора текстового файла и нажатия кнопки «Импорт» выберите символ для использования из списка в разделе «Разделитель».Вы можете сразу же увидеть результат своего нового выбора в предварительном просмотре данных, поэтому вы можете быть уверены, что сделали правильный выбор, прежде чем продолжить.

Если вы используете мастер импорта текста для импорта текстового файла, вы можете изменить разделитель, используемый для операции импорта, на шаге 2 мастера импорта текста. На этом шаге вы также можете изменить способ обработки последовательных разделителей, таких как последовательные кавычки.

Дополнительную информацию о разделителях и дополнительных параметрах см. в Мастере импорта текста.

Если вы хотите использовать точку с запятой в качестве разделителя списка по умолчанию при сохранении файла .csv, но вам нужно ограничить изменение Excel, рассмотрите возможность изменения десятичного разделителя по умолчанию на запятую. В этом случае Excel будет использовать точку с запятой. -двоеточие для разделителя списка. Очевидно, что это также изменит способ отображения десятичных чисел, поэтому рассмотрите возможность изменения разделителя тысяч, чтобы избежать путаницы.

Очистить параметры Excel > Дополнительно > Параметры редактирования > Использовать системные разделители.

Установите для десятичного разделителя значение , (запятая).

Установите для разделителя тысяч значение . (точка).

При сохранении книги в виде CSV-файла разделителем списка по умолчанию является запятая. Вы можете изменить его на другой символ-разделитель, используя настройки региона Windows.

Внимание! Изменение настроек Windows вызовет глобальные изменения на вашем компьютере, затрагивающие все приложения. Чтобы изменить разделитель только для Excel, см. раздел Изменение разделителя списка по умолчанию для сохранения файлов в виде текста (.csv) в Excel.

В Microsoft Windows 10 щелкните правой кнопкой мыши кнопку "Пуск" и выберите "Параметры".

Нажмите «Время и язык», а затем нажмите «Регион» на левой панели.

На главной панели в разделе «Региональные настройки» нажмите «Дополнительные настройки даты, времени и региона».

В разделе "Регион" нажмите "Изменить формат даты, времени или чисел".

В диалоговом окне "Регион" на вкладке "Формат" нажмите "Дополнительные параметры".

В диалоговом окне "Настройка формата" на вкладке "Числа" введите символ, который будет использоваться в качестве нового разделителя в поле "Разделитель списка".

Дважды нажмите "ОК".

В Microsoft Windows нажмите кнопку "Пуск" и выберите "Панель управления".

В разделе Часы, язык и регион нажмите Изменить формат даты, времени или чисел.

В диалоговом окне "Регион" на вкладке "Формат" нажмите "Дополнительные параметры".

В диалоговом окне "Настройка формата" на вкладке "Числа" введите символ, который будет использоваться в качестве нового разделителя в поле "Разделитель списка".

Дважды нажмите "ОК".

Примечание. После изменения символа-разделителя списка на вашем компьютере все программы используют новый символ в качестве разделителя списка. Вы можете изменить символ обратно на символ по умолчанию, выполнив ту же процедуру.

Нужна дополнительная помощь?

Вы всегда можете обратиться к эксперту в техническом сообществе Excel или получить поддержку в сообществе ответов.

Если вы хотите один раз загрузить файл CSV в datapine, выберите вариант прямой загрузки. Это быстрый и простой способ передать данные в базу данных.

Обратите внимание: файлы, загруженные с вашего локального компьютера, нельзя обновить.

1) Проверьте, соответствует ли ваш CSV-файл нашим требованиям в отношении структуры и формата файла.

2) Выберите ПОДКЛЮЧИТЬСЯ в левом верхнем углу панели навигации.

3) Если у вас уже есть подключенный источник данных, нажмите +ДОБАВИТЬ ИСТОЧНИК ДАННЫХ. Если нет, вы сразу перейдете к следующему шагу.

4) В следующем представлении выберите тип источника данных CSV с локального диска (ПК).

5) Теперь вы можете либо перетащить CSV-файл в выделенную область, либо выбрать путь к CSV-файлу вручную, нажав кнопку «Обзор».

6) Структура вашего файла CSV будет отображаться на экране предварительного просмотра и может быть отформатирована или отредактирована. datapine пытается автоматически определить правильный формат вашего файла, но это не всегда работает, и вам может потребоваться настроить формат вашего файла. У вас будут следующие параметры для настройки импорта CSV:

a) Имя: Дайте вашему файлу имя. Это имя будет отображаться в структуре источника данных в Создателе диаграмм и поможет вам отличить этот источник данных от других.

b) Формат: Если datapine не распознает структуру вашего файла автоматически, вам может потребоваться выбрать другой формат. Вы можете выбирать между Microsoft Excel CSV, стандартными листами с разделителями-запятыми, а также пользовательскими форматами с отдельными разделителями полей и кавычками.

c) Заголовки: если заголовки файла не определяются автоматически, вы можете вручную выбрать, хотите ли вы включать их или нет. У вас также есть возможность изменить или добавить отдельные имена в свои столбцы — и все это без внесения изменений в базовый CSV. Просто щелкните заголовок визуализированной таблицы и измените имя столбца.

d) Разделитель полей: выберите разделитель полей, который используется в вашем файле e. грамм. запятая (,), точка с запятой (;) или символ табуляции. Для пользовательских форматов вы можете напрямую ввести свой индивидуальный разделитель полей.

e) Цитата: выберите тип кавычек, которые используются для текстовых значений. e. грамм. одиночные (') или двойные кавычки ("). Для пользовательских форматов вы можете напрямую ввести свою индивидуальную цитату.

f) Имена столбцов. Измените название столбцов, щелкнув заголовок и введя новое имя столбца. Это будут имена полей, отображаемые в редакторе диаграмм.

g) Включить/исключить столбцы. Вы можете исключить один или несколько столбцов в CSV-файле из импорта, просто сняв флажок под названием столбца.

h) Тип данных: проверьте, определил ли datapine правильный тип данных ваших столбцов. Мы различаем целые числа, текст/смешанный, десятичный, дату, отметку времени в секундах. и Отметка времени в миллисекундах. Если вам нужно изменить тип данных столбца, щелкните значок раскрывающегося списка и выберите правильный тип данных.

В этой статье приведены некоторые советы по созданию и форматированию файлов, загружаемых в Google Analytics. Эти файлы должны быть правильно отформатированы, иначе могут возникнуть ошибки загрузки.

Общие соображения

  1. Файлы данных должны быть загружены в формате CSV (значения, разделенные запятыми).
  2. Заголовок CSV-файла должен точно соответствовать схеме целевого набора данных. Порядок столбцов должен быть таким же, как указано в схеме, и все имена столбцов должны использовать внутренний ga. имя параметра или показателя, а не отображаемое имя. (например, ga:source , а не Source .)
  3. Загружаемые данные должны быть правильно отформатированы. Подробнее см. ниже.

Создайте файл загрузки

Хотя вы можете использовать любой удобный для вас метод, существует два простых способа создать загружаемый файл: с помощью текстового редактора или с помощью приложения для работы с электронными таблицами. Независимо от того, как вы создаете файл, вам потребуется схема набора данных, чтобы создать заголовок загружаемого файла.

Получить схему

Вы можете скопировать или загрузить схему набора данных, отредактировав набор данных и нажав кнопку "Получить схему".

Используйте текстовый редактор

Чтобы создать файл загрузки с помощью текстового редактора, просто скопируйте и вставьте схему в первую строку нового файла. Затем вы можете добавить свои данные, по одной записи в строке, под этим заголовком.

Убедитесь, что ваш редактор создает простые текстовые файлы. Редакторы форматированного текста, такие как Microsoft Word, не следует использовать, если вы явно не сохраните свои файлы как обычный текст (.txt). Формат RTF содержит дополнительные символы форматирования и управляющие символы, которые могут вызвать ошибки импорта.

Использовать электронную таблицу

Чтобы использовать электронную таблицу для загрузки данных, выполните описанные выше действия, чтобы получить схему набора данных. Затем нажмите кнопку Скачать шаблон схемы. Это поместит заголовки схемы в каталог загрузок. Затем вы можете открыть схему в своей любимой электронной таблице. Используйте функцию импорта электронной таблицы, чтобы ввести данные, которые вы хотите загрузить. Когда ваш файл будет готов к загрузке, используйте функцию Сохранить как или Экспорт вашей программы для работы с электронными таблицами и выберите CSV в качестве выходного формата.

Отформатируйте загружаемые данные

При импорте данных каждая строка файла загрузки должна содержать информацию об одном обращении. Отдельные параметры и показатели, из которых состоит обращение, отделяются друг от друга запятыми. Каждая строка в файле заканчивается разрывом строки. Если в фактических данных, которые вы хотите загрузить, есть запятые, эти данные должны быть заключены в кавычки. Вероятно, наиболее распространенной причиной ошибок содержимого является неправильное использование запятых, кавычек и символов разрыва строки в загружаемых данных, поэтому понимание того, как импорт данных обрабатывает их, может избавить вас от проблем в будущем.

Запятые

По определению, в файле CSV для начала новой ячейки используются запятые. Другими словами, когда программа импорта данных видит запятую без экранирования, предполагается, что вы начинаете новую запись столбца. В приведенном ниже примере показаны правильно отформатированные данные:

В этом случае при импорте данных отображаются четыре столбца данных:

abc123 29,99 Синий XXL
def345 100 Красный M
ghi678 1035,20 Зеленый S

Но что произойдет, если мы добавим к данным дополнительную запятую, например, отформатировав числовой столбец как денежную единицу (добавив запятую для обозначения разряда тысяч, как здесь?

Теперь, из-за лишней запятой, когда вы пытаетесь загрузить этот файл, программа импорта данных видит пять столбцов, создавая таблицу загрузки, которая выглядит следующим образом:

abc123 29,99 Синий XXL
def345 100 Красный M
ghi678 1 035.20 Зеленый S

Это вызовет ошибку, например следующую:

"Ошибка: количество столбцов не совпадает"

Цитаты

Двойные кавычки можно использовать для "экранирования" значения ячейки. Как правило, вы заключаете значение ячейки в кавычки, если значение содержит запятую. В противном случае импорт данных будет интерпретировать запятую как начало новой ячейки (см. выше).

Значение "1035,20" будет рассматриваться как одна ячейка (однако функция импорта данных увидит его как строку, а не значение в денежной единице).

При экранировании ячейки с кавычками количество кавычек должно быть сбалансировано. Если в данной строке нечетное количество кавычек, импорт завершится ошибкой с сообщением, например:

"Ошибка: недопустимый формат CSV в строке x".

Разрывы строк

Разрывы строк в файле CSV используются для обозначения начала новой строки. Импорт данных не поддерживает разрывы строк внутри ячеек, даже если они заключены в кавычки. Дополнительные разрывы строк в строке вызовут ошибку количества столбцов в этой строке или в одной из следующих строк, что приведет к появлению сообщения об ошибке, например:

Инструмент "Загрузить данные" принимает файлы в формате файлов с разделителями-запятыми (CSV) (т. е. файлы с расширением .csv). Эти файлы данных используются для выполнения операций пакетного добавления, редактирования или удаления. Файлы CSV можно просматривать и манипулировать с помощью приложения для работы с электронными таблицами или текстового редактора. В этом документе приводятся советы по работе с CSV-файлами, сохранению файловой структуры и общим рекомендациям по подготовке данных.

Структура файла CSV

Шаблоны CSV или файлы данных можно загрузить по ссылкам в верхней части инструмента "Загрузить данные". Первая строка шаблона или файла данных содержит заголовки столбцов. Каждая последующая строка соответствует записи в базе данных. Когда шаблон CSV загружается, он содержит только заголовки столбцов. Поскольку для добавления новых записей используются шаблоны, для каждой записи будут добавляться новые строки. При загрузке файла данных CSV первая строка содержит заголовок столбца, а последующие строки содержат записи данных, которые уже существуют в базе данных. Записи в этих строках можно редактировать или удалять.

В файле CSV каждая строка содержит упорядоченную последовательность заголовков или значений столбцов, разделенных запятыми. Запятые используются для сохранения структуры файла. Каждая запятая в первой строке (которая содержит заголовки столбцов) ограничивает заголовок столбца и место в упорядоченной последовательности столбцов. Запятые в последующих строках также поддерживают последовательность упорядоченных столбцов, поэтому первое значение в каждой последующей строке представляет значение в первом столбце, второе значение в каждой последующей строке представляет значение во втором столбце и так далее. В отличие от стандартной пунктуации предложения, после запятой нет пробела.

Большинство значений заключено в двойные кавычки. Исключение составляет односимвольное значение, например 1 или 0 (ноль). Заключение значения в двойные кавычки позволяет использовать сложные значения, например содержащие запятые, в поле без нарушения структуры файла. Например, поле, содержащее ряд элементов, таких как любимые цвета, может иметь такое значение:

"красный, зеленый и синий"

Вы не обязательно будете знать об этих кавычках при просмотре файла данных в приложении для работы с электронными таблицами, но они отображаются при просмотре файла в текстовом редакторе.

Представление файла данных CSV в текстовом редакторе

Вот упрощенный пример файла 'company.csv', как он будет выглядеть при просмотре в текстовом редакторе. Заголовок первого столбца в вашем файле данных всегда должен быть «upload_action», который используется, чтобы сообщить инструменту «Загрузить данные», какое действие следует выполнить с этой строкой. В этом примере файл данных был загружен для редактирования выбранных записей. Первая строка содержит заголовки столбцов, а вторая и последующие строки содержат записи данных. Первое поле в каждой строке соответствует заголовку столбца «upload_action». Это предварительно заполнено для действия «редактировать» при загрузке файла данных. В этом примере заголовок второго столбца — «item_key», а третий — «название компании». Ключ элемента всегда требуется для операций редактирования или удаления, и его нельзя редактировать.

Советы по работе с CSV-файлами

Вся система ломается, если в строке отсутствует или лишняя запятая. Каждое значение после этого отсутствующего или дополнительного поля данных будет введено в неправильный столбец. В худшем случае база данных может быть повреждена настолько серьезно, что потребуется вернуться к резервной версии, что приведет к потере самых последних изменений данных и колоссальной головной боли для администратора, поэтому очень важно поддерживать файловую структуру.< /p>

Столбцы в CSV-файле могут отображаться в любом порядке, если эта последовательность сохраняется. Другими словами, порядок, в котором заголовки столбцов появляются в первой строке, должен повторяться в последующих строках данных, чтобы данные в каждом поле можно было сопоставить с правильным столбцом.

Вы можете опустить любые столбцы, в которые вы не хотите добавлять или редактировать данные, если только этот столбец не требуется инструментом загрузки данных, правилами конфигурации базы данных или сайта. На самом деле рекомендуется опускать ненужные столбцы, чтобы упростить структуру файла данных и снизить вероятность внесения ошибок в ненужный столбец. Вы не можете опустить поля, необходимые для инструмента «Выгрузить данные», но вы можете опустить поля, необходимые для базы данных, при условии, что значение по умолчанию подходит для всех записей, которые вы добавляете или редактируете. Если значение по умолчанию не подходит ни для одной из записей в вашем файле данных, вы должны включить этот столбец и указать соответствующие значения для этих записей.

Поля назначения в базе данных хранят разные версии значений, представленных на веб-страницах. Например, цель пользователя «Представитель компании» хранится в базе данных как «company_rep». Значения сопоставляются друг с другом и преобразуются по мере загрузки и выгрузки данных из базы данных. Возможно, вам будет проще использовать значение из базы данных, которое вы увидите, если загрузите файл данных в формате CSV по ссылкам вверху файла загрузки данных.

Редактирование CSV-файлов в электронной таблице или текстовом редакторе

Файлы формата CSV прекрасны, потому что они совместимы со всеми типами текстовых редакторов и приложений для работы с электронными таблицами, но электронные таблицы, как правило, хотят повредить данные, поэтому вы должны быть начеку. Текстовые редакторы, как правило, гораздо лучше себя ведут, поэтому те, кому удобно работать с файловой структурой CSV в текстовых редакторах, могут использовать любой текстовый редактор, который они предпочитают.

Но многие люди предпочитают использовать программу для работы с электронными таблицами, а данные уязвимы при импорте (когда начальные нули могут быть удалены или длинные числа преобразованы в стандартную запись и округлены) и при экспорте (когда могут быть добавлены посторонние символы). Вы можете даже не заметить, что ваши данные изменились, пока вы не экспортируете файл в CSV и не откроете его в текстовом редакторе. Символы, которые были скрыты при просмотре файла в приложении для работы с электронными таблицами, внезапно становятся видимыми при просмотре файла в текстовом редакторе. Если вы хотите использовать электронную таблицу, вы должны заранее подготовить ее для работы с числовыми значениями и очистить все неверные символы в выводе.

Подготовка электронной таблицы для загруженных данных

Если есть вероятность, что в вашем файле данных есть значения, содержащие числа, которые не следует рассматривать как обычные числовые значения (например, почтовые индексы, идентификаторы и т. д.), вам следует сначала открыть файл в текстовом редакторе, чтобы определить какие столбцы содержат эти виды значений. Откройте пустую электронную таблицу отдельно, выберите любые столбцы, в которых будут отображаться данные такого типа, и установите тип данных «Текст». В большинстве случаев вы можете установить для каждого столбца электронной таблицы значение «Текст». Как ни странно, последовательность действий, позволяющих это сделать, обычно представляет собой вариант выбора «Форматировать ячейку», затем вкладки «Число», затем выбора «Текст».

Тестирование приложения для работы с электронными таблицами

Прежде чем загружать отредактированный файл данных, проверьте свое любимое приложение для работы с электронными таблицами, чтобы убедиться, что файл экспортируется корректно или нет.

Как протестировать приложение для работы с электронными таблицами:

Откройте файл CSV в приложении для работы с электронными таблицами, отредактируйте данные и сохраните файл в формате .csv. Возможно, вам захочется потренироваться на фиктивном файле, который вы не собираетесь загружать, или внести простые изменения данных в одну тестовую компанию или тестового пользователя или в свою личную учетную запись, если она у вас есть.

Откройте отредактированный файл .csv в текстовом редакторе и проверьте, заключены ли значения полей в двойные кавычки (за исключением одинарных/символьных значений) — это хорошо — и нет посторонних символов — это плохо Предмет. Наиболее распространенный скрытый символ, вставляемый приложениями для работы с электронными таблицами, — это символ новой строки, поэтому ищите '/n' или '^n' в конце строки данных. Если вы видите двойные кавычки и не видите символов новой строки (или других странностей), переходите к следующему тесту.

Если вы использовали фактические данные и хотите загрузить данные сейчас, используйте функцию тестового прогона инструмента "Загрузить данные", чтобы выполнить тестовую загрузку вашего файла, чтобы изменения, внесенные вами в учебный файл, не были немедленно зафиксированы в базе данных. Если все работает должным образом и в отчете о загрузке данных не упоминается об обнаружении каких-либо посторонних символов, вы сможете без проблем выполнить экспорт в .csv из приложения для работы с электронными таблицами.

Уборка после приложения для работы с электронными таблицами

Если вы обнаружите, что ваше непослушное приложение для работы с электронными таблицами вставило символы в ваш файл данных .csv, вы все равно можете использовать это приложение для работы с электронными таблицами, при условии, что вы очистите его, открыв файл данных .csv в текстовом редакторе и удалив все нежелательные символов, прежде чем приступить к загрузке данных.

В идеале данные в каждом поле должны быть заключены в двойные кавычки.Если после экспорта в файле присутствуют двойные фигурные кавычки, выполните операцию поиска и замены, чтобы заменить фигурные кавычки двойными прямыми кавычками. Одинарные фигурные кавычки следует заменить одинарными прямыми кавычками.

Подготовка файла данных

Упростите свой файл данных или шаблон, удалив все столбцы, которые не требуются инструменту загрузки, не требуются базе данных и бесполезны в данных обстоятельствах. Сюда входят все столбцы, связанные с членством (кроме member_types, в котором фактически хранятся типы пользователей), поскольку данные о членстве нельзя редактировать с помощью инструмента «Загрузить данные».

Добавьте столбец "upload_action" и укажите, какое действие вы хотите выполнить с этой записью (например, "добавить", "изменить", "удалить").

Если вы загрузили файл данных и выполняете операцию редактирования или удаления, удалите все строки (записи), которые вы хотите оставить без изменений (т. е. строки, которые вы не хотите редактировать или удалять).

Выполните базовую проверку данных, как описано в следующем разделе.

После выполнения этих шагов завершите подготовку данных, следуя инструкциям в разделах «Как добавить записи с помощью загрузки данных» или «Как изменить или удалить записи с помощью загрузки данных».

Проверка основных данных

Важно выполнить базовую проверку данных до, во время или после импорта данных в CSV-файл — как вам будет удобнее.

Проверьте наличие этих и подобных распространенных ошибок:

Чтобы устранить наиболее распространенную причину ошибок, постарайтесь сохранить правильную структуру в файле, разделенном запятыми/разделителями.

Убедитесь, что столбец «upload_action» присутствует и ему назначены правильные значения, как того требует инструмент «Загрузить данные». Он включен в качестве первого столбца в шаблоны и файлы данных, но если вы получили данные с помощью инструментов отчетности или других источников, вам необходимо добавить столбец «upload_action».

В столбце "upload_action" должно быть значение, указывающее действие, которое вы хотите выполнить с этой строкой: "добавить", "изменить" или "удалить". Записи, в которых данные не должны изменяться, могут быть обозначены словом «нет», но лучше вообще исключить эти строки. Значения действия загрузки должны быть указаны строчными буквами.

При добавлении записей всегда проверяйте наличие дубликатов и удаляйте их. База данных Members не позволяет вводить одно и то же имя дважды (если только цели не различаются), но дубликаты могут возникать, когда компания или пользователь, которые уже существуют в базе данных, снова вводятся под немного другим именем (например, ' Example Company" и "Example Co.", "John Q Public" и "Jon Quincy Public").

Проверьте формат всех полей, содержащих даты. Правильный формат даты — ГГГГ/ММ/ДД для всех полей, связанных с датой. 'membership_start_dates' и 'membership_end_dates' являются исключением из этого правила. Эти поля могут содержать даты для нескольких членств в виде строки с разделителями-запятыми. Даты в других форматах не будут сразу отклонены во время проверки, но инструмент загрузки данных попытается принудительно преобразовать данные в формат ГГГГ/ММ/ДД, что может привести к повреждению данных в неправильно отформатированных полях даты.

Читайте также: