Ошибка формата файла, выберите правильный файл данных для загрузки
Обновлено: 21.11.2024
При попытке массовой загрузки пользователей я получил следующее сообщение об ошибке:
По какой-то причине данные для импорта не были готовы на наших серверах. Попробуйте снова. Мы были уведомлены об этом и решим проблему, если есть ошибка. Если ошибка повторится, обратитесь в нашу службу поддержки клиентов. Ошибка: недопустимая последовательность байтов в UTF-8.
Как исправить ошибку UTF-8 при массовой загрузке пользователей?
Ответить
Эта ошибка возникает, если загруженный файл имеет формат, отличный от UTF-8. UTF-8 — это основной формат кодировки символов во всемирной паутине.
Эта ошибка возникает из-за того, что используемое вами программное обеспечение сохраняет файл в кодировке другого типа, например ISO-8859, вместо UTF-8.
Существуют различные решения, которые можно использовать для преобразования файла в кодировку UTF-8.
Если у вас есть учетная запись Gmail или вы ранее использовали Google Диск
- Откройте Google Диск.
- Создайте новый документ Google Sheets.
- В новом документе Google Таблиц импортируйте файл CSV.
- После импорта файла вы можете нажать «Файл» > «Загрузить как» > «Значения, разделенные запятыми», чтобы сохранить файл на свой компьютер.
Теперь файл должен быть в кодировке UTF-8, и он будет успешно загружен.
Если вы используете Microsoft Excel
- Откройте файл CSV в Microsoft Excel, затем нажмите «Файл» > «Сохранить как».
- Введите любое имя для файла, затем выберите "CSV UTF-8 (с разделителями-запятыми) (*.csv)" в качестве нужного формата файла.
- Нажмите "Сохранить".
Если вы используете Microsoft Excel в Windows, но не можете сохранять файлы в формате CSV с кодировкой UTF-8 и у вас есть Блокнот
- Откройте файл .xlsx в Microsoft Excel, затем нажмите «Файл» > «Сохранить как (другие форматы)».
- Введите любое имя для файла, затем выберите "Текст Unicode (.txt)" для "Сохранить как тип".
- Нажмите "Сохранить".
- Откройте текстовый файл Unicode с помощью Блокнота Microsoft.
Некоторые символы отображаются в виде рамки. Это связано с тем, что Блокнот не может отображать некоторые символы Юникода. Вы можете пока игнорировать эти символы. - Замените табуляцию запятыми (","), чтобы файл .xlsx был разделен запятыми и имел правильный формат значений, разделенных запятыми (CSV).
- Выберите символ табуляции, перетащив его между заголовками двух столбцов и нажав CTRL+C.
- Используйте функцию замены (CTRL+H), чтобы заменить все символы табуляции запятыми.
- В Блокноте нажмите "Сохранить как".
- Введите имя файла и измените кодировку на "UTF-8".
- Добавьте .csv в конце имени файла, чтобы изменить расширение файла с ".txt" на ".csv".
- Нажмите "Сохранить".
Значок файла теперь должен измениться на Microsoft Excel. - Откройте файл CSV в Excel и проверьте данные.
Даже если вы обнаружите проблему, не сохраняйте файл в Excel. Это снова вызовет проблему с кодировкой. Просто проверяйте данные только в Excel. Если вы видите проблему с данными на этом этапе, исправьте данные из исходной электронной таблицы и повторите шаги. Вы также можете изменить файл из Блокнота, но обязательно сохраните файл в формате UTF-8.
Теперь вы можете использовать этот CSV-файл для импорта.
Если вы используете другую программу, вы можете вручную изменить кодировку, которую она использует при сохранении файла. Возможно, вам потребуется проверить документацию компании, чтобы узнать, как изменить кодировку, или обратиться в службу поддержки клиентов.
В этой статье приведены некоторые советы по созданию и форматированию файлов, загружаемых в Google Analytics. Эти файлы должны быть правильно отформатированы, иначе могут возникнуть ошибки загрузки.
Общие соображения
- Файлы данных должны быть загружены в формате CSV (значения, разделенные запятыми).
- Заголовок CSV-файла должен точно соответствовать схеме целевого набора данных. Порядок столбцов должен быть таким же, как указано в схеме, и все имена столбцов должны использовать внутренний ga. имя параметра или показателя, а не отображаемое имя. (например, ga:source , а не Source .)
- Загружаемые данные должны быть правильно отформатированы. Подробнее см. ниже.
Создайте файл загрузки
Хотя вы можете использовать любой удобный для вас метод, существует два простых способа создать загружаемый файл: с помощью текстового редактора или с помощью приложения для работы с электронными таблицами. Независимо от того, как вы создаете файл, вам потребуется схема набора данных, чтобы создать заголовок загружаемого файла.
Получить схему
Вы можете скопировать или загрузить схему набора данных, отредактировав набор данных и нажав кнопку "Получить схему".
Используйте текстовый редактор
Чтобы создать файл загрузки с помощью текстового редактора, просто скопируйте и вставьте схему в первую строку нового файла. Затем вы можете добавить свои данные, по одной записи в строке, под этим заголовком.
Убедитесь, что ваш редактор создает простые текстовые файлы.Редакторы форматированного текста, такие как Microsoft Word, не следует использовать, если вы явно не сохраните свои файлы как обычный текст (.txt). Формат RTF содержит дополнительные символы форматирования и управляющие символы, которые могут вызвать ошибки импорта.
Использовать электронную таблицу
Чтобы использовать электронную таблицу для загрузки данных, выполните описанные выше действия, чтобы получить схему набора данных. Затем нажмите кнопку Скачать шаблон схемы. Это поместит заголовки схемы в каталог загрузок. Затем вы можете открыть схему в своей любимой электронной таблице. Используйте функцию импорта электронной таблицы, чтобы ввести данные, которые вы хотите загрузить. Когда ваш файл будет готов к загрузке, используйте функцию Сохранить как или Экспорт вашей программы для работы с электронными таблицами и выберите CSV в качестве выходного формата.
Отформатируйте загружаемые данные
При импорте данных каждая строка файла загрузки должна содержать информацию об одном обращении. Отдельные параметры и показатели, из которых состоит обращение, отделяются друг от друга запятыми. Каждая строка в файле заканчивается разрывом строки. Если в фактических данных, которые вы хотите загрузить, есть запятые, эти данные должны быть заключены в кавычки. Вероятно, наиболее распространенной причиной ошибок содержимого является неправильное использование запятых, кавычек и символов разрыва строки в загружаемых данных, поэтому понимание того, как импорт данных обрабатывает их, может избавить вас от проблем в будущем.
Запятые
По определению, в файле CSV для начала новой ячейки используются запятые. Другими словами, когда программа импорта данных видит запятую без экранирования, предполагается, что вы начинаете новую запись столбца. В приведенном ниже примере показаны правильно отформатированные данные:
В этом случае при импорте данных отображаются четыре столбца данных:
abc123 | 29,99 | Синий | XXL |
def345 | 100 | Красный | M |
ghi678 | 1035,20 | Зеленый | S |
Но что произойдет, если мы добавим к данным дополнительную запятую, например, отформатировав числовой столбец как денежную единицу (добавив запятую для обозначения разряда тысяч, как здесь?
Теперь, из-за лишней запятой, когда вы пытаетесь загрузить этот файл, программа импорта данных видит пять столбцов, создавая таблицу загрузки, которая выглядит следующим образом:
abc123 | 29,99 | Синий | XXL | |
def345 | 100 | Красный | M | |
ghi678 | 1 | 035.20 | Зеленый | S |
Это вызовет ошибку, например следующую:
"Ошибка: количество столбцов не совпадает"
Цитаты
Двойные кавычки можно использовать для "экранирования" значения ячейки. Как правило, вы заключаете значение ячейки в кавычки, если значение содержит запятую. В противном случае импорт данных будет интерпретировать запятую как начало новой ячейки (см. выше).
Значение "1035,20" будет обработано как одна ячейка (однако функция импорта данных увидит его как строку, а не значение в валюте).
При экранировании ячейки с кавычками количество кавычек должно быть сбалансировано. Если в данной строке нечетное количество кавычек, импорт завершится ошибкой с сообщением, например:
"Ошибка: недопустимый формат CSV в строке x".
Разрывы строк
Разрывы строк в файле CSV используются для обозначения начала новой строки. Импорт данных не поддерживает разрывы строк внутри ячеек, даже если они заключены в кавычки. Дополнительные разрывы строк в строке вызовут ошибку количества столбцов в этой строке или в одной из следующих строк, что приведет к появлению сообщения об ошибке, например:
При попытке массового обновления часто задаваемых вопросов может появиться несколько различных сообщений об ошибках. Вот некоторые универсальные шаги, которые помогут избежать ошибок любого из этих типов:
- Не используйте Excel или любой другой редактор документов, не совместимый с Unicode, для сохранения файла CSV. Это включает в себя копирование и вставку из этих типов документов. Используйте Ctrl + Shift + V (ПК) или Command + Shift + V (Mac), чтобы удалить все форматирование при переносе данных из других документов.
- Если при открытии или сохранении файлов вам будет предложено выбрать разделитель полей, выберите запятые — это устранит проблемы, с которыми вы сталкиваетесь при работе с ячейками и форматированием. (UTF-8) сохранит ваш документ для импорта. Для этого мы рекомендуем использовать Open Office (бесплатно), Numbers (Mac) или Google Sheets. Вам также потребуется использовать одну из этих программ, если вы включаете в электронную таблицу специальные символы (например, из другого языка), которые необходимо преобразовать в CSV для загрузки в Helpshift.
Ниже приведены шаги по устранению каждого типа сообщений об ошибках, которые могут появиться при массовом обновлении:
Проблемы с открытием CSV
При попытке открыть CSV-файл с помощью Excel вы можете увидеть предупреждение о том, что «Excel обнаружил, что «[filename].csv» является файлом SYLK, но не может его загрузить. Либо в файле есть ошибки, либо это не формат файла SYLK. Нажмите OK, чтобы попытаться открыть файл в другом формате.’
Это связано с тем, что форматирование по умолчанию, автоматически применяемое Excel, несовместимо с форматом, необходимым для плавной загрузки. Если вы уже редактировали CSV-файл с помощью Excel, несовместимой программы или копировали из документа, не поддерживающего Юникод, дважды щелкните каждую ячейку при копировании текста и используйте сочетание клавиш Ctr-Shift-V (ПК) или Command+Shift+V (Mac). ) при вставке, чтобы удалить все форматирование при переносе данных из других документов. Сохранение или экспорт в формате Unicode (UTF-8) сохранит форматирование вашего документа.
Другой тип предупреждений, часто встречающийся в Excel, выглядит следующим образом: «Эта книга содержит функции, которые не будут работать или могут быть удалены, если вы сохраните ее в выбранном формате файла». Хотите продолжить?
Вы увидите это сообщение, если вы сохранили файл в устаревшем формате файла Excel, например .xls. Ошибка не появится, если вы сохраните файл в текущем формате, например .xlsx, .xltx или .xlsb. Вы можете изменить тип файла в диалоговом окне «Сохранить как».
Чтобы избежать этой ошибки, мы рекомендуем использовать Open Office, Numbers (только для Mac) или Google Таблицы.
Проблемы с сохранением файла CSV на определенном языке (со специальными символами)
Вы можете увидеть ошибку при сохранении CSV-файла на языке со специальными символами, когда специальный символ (å) в файле меняется на вопросительный знак (?) или пустую строку (___). Это помешает вам сохранить файл.
Это происходит при использовании Excel или другого редактора документов, несовместимого с Unicode, для редактирования файла. Мы рекомендуем использовать Open Office, Numbers (только для Mac) или Google Таблицы, чтобы избежать этой ошибки.
Если у вас по-прежнему возникают проблемы с сохранением текста и форматированием, свяжитесь с нами через нашу контактную страницу и прикрепите файл CSV.
Платформа SurveyCTO предлагает экспорт в формат CSV (и другие) и позволяет загружать данные извне платформы в формате CSV или Excel. Если вы не знакомы с данными, разделенными запятыми (CSV), и вам сложно работать с экспортированными CSV-файлами или создавать CSV-файлы, которые работают должным образом, эта статья для вас. Читайте дальше, чтобы узнать:
- Что такое CSV-файл.
- Импорт и редактирование CSV-файлов.
- Когда использовать файлы Excel или .csv.
- Распространенные проблемы с созданием CSV-файлов.
- Советы по созданию рабочих CSV-файлов с помощью популярных программ.
Что такое CSV-файл?
Файл со значениями, разделенными запятыми (CSV), является наиболее распространенным и основным форматом для хранения данных. В файле .csv хранится таблица значений со столбцами, разделенными запятыми, и с разрывами строк, разделяющими строки. Формат файла .csv обычно используется для передачи данных между программными системами благодаря его простому и единообразному формату.
Слева вы видите обычную таблицу данных. Справа вы видите ту же таблицу данных в формате CSV.
Импорт и редактирование CSV-файлов
Независимо от того, экспортируете ли вы данные CSV из SurveyCTO или получаете их из другого источника, вы должны сначала импортировать их в подходящую программу для работы с ними, например Microsoft Excel, Google Sheets, Stata и подобные. В зависимости от ваших планов использования (см. следующий раздел) вы можете сохранить данные в формате Excel, который SurveyCTO также принимает в качестве формата загрузки.
См. нашу документацию по импорту данных CSV в Excel для получения рекомендаций (особенно если у вас возникли проблемы с тем, как выглядят импортированные данные CSV). Для другого программного обеспечения вы должны быть уверены, что импортирующее программное обеспечение распознает а.) разделитель, который используется в файле .csv (например, запятая), б.) и что формат кодировки файла — UTF-8, если вы вы работаете с использованием неанглийского алфавита или латинского алфавита, в котором используются специальные символы (более подробно обсуждается ниже).
Отредактируйте импортированные данные, сохраните свою работу и при необходимости снова экспортируйте в формат CSV.
Когда использовать файлы .csv или Excel
Как и выше, SurveyCTO принимает загрузку данных в форматах CSV и Excel. Книги Excel не являются внутренним поддерживаемым форматом данных, но для удобства они преобразуются в .csv на сервере. Чем больше строк и столбцов данных вы загружаете, тем больше времени займет процесс преобразования. Как правило, если вы загружаете количество записей, приближающееся к 10 000 или превышающее его, возможно, стоит самостоятельно преобразовать их в CSV перед загрузкой данных.
Чтобы сохранить специальные символы в книге Excel (см. раздел ниже), их следует вводить шрифтом в кодировке UTF-8. Кодировка символов Excel шире, чем UTF-8, поэтому то, что выглядит правильно в Excel, может выглядеть иначе после процесса преобразования на сервере. Если у вас возникли проблемы с сохранением специальных и неанглийских символов при загрузке из Excel, это также может быть причиной для предварительного экспорта в CSV, чтобы вы могли просмотреть данные CSV в текстовом редакторе перед загрузкой.
В противном случае, если вы предпочитаете работать в Excel, это будет наиболее удобный формат.
Распространенные проблемы с созданием CSV-файлов
Несмотря на простой и распространенный тип файлов, пользователи SurveyCTO сталкиваются с некоторыми распространенными проблемами при создании файлов .csv.
Использование точки с запятой вместо запятой
Некоторые компьютеры создают файлы .csv, в которых значения разделяются точкой с запятой ( ; ) вместо запятой ( , ). Тем не менее, SurveyCTO ожидает, что при загрузке на платформу будут представлены истинные данные, разделенные запятыми. Например, если вы загрузите файл .csv, в котором используются точки с запятой, в набор данных сервера, вы можете увидеть следующий результат:
На приведенном выше снимке экрана данные CSV, загруженные в набор данных сервера, отображаются с помощью интерфейса «Редактировать». Данные, разделенные точкой с запятой, заполняют один столбец набора данных сервера. Поскольку запятых не было, данные интерпретируются как имеющие один столбец вместо четырех, как можно было бы ожидать.
Данные, сохраненные таким образом, не могут быть извлечены, как можно было бы ожидать при использовании предварительной загрузки.
Специальные символы не сохраняются
Если вы работаете с неанглийским шрифтом или латинским алфавитом, в котором используются специальные символы, сохранение такого текста в формате файла .csv может привести к проблемам с его правильным отображением. Либо весь текст, либо только специальные символы будут заменены символами или другими символами. Это связано с кодировкой символов. В то время как английские символы поддерживаются более старыми и менее гибкими стандартами кодирования, такими как ASCII, более широкий спектр используемых алфавитов поддерживается более современными стандартами, такими как UTF-8, который предпочитает платформа SurveyCTO.
Слева вы видите неправильно закодированные французские специальные символы, сохраненные в формате ASCII, а справа вы можете видеть тот же текст, правильно закодированный в формате UTF-8.
Если у вас возникнут проблемы с кодировкой, SurveyCTO Desktop может помочь. Попробуйте следующее, чтобы перекодировать файл .csv в UTF-8. Для этого:
- В SurveyCTO Desktop нажмите Автономные инструменты формы в левом верхнем углу.
- Нажмите Перекодировать файл .csv.
- Нажмите Обзор и выберите CSV-файл, который нужно закодировать.
- В разделе Выбрать исходную кодировку выберите текущую кодировку CSV-файла. Если вы не знаете, попробуйте каждый из них, пока специальные символы не будут правильно отображаться в разделе Предварительный просмотр.
- Необязательно: установите флажок Заменить существующий файл, если вам не нужна резервная копия старой версии файла. Однако на всякий случай рекомендуется сохранить исходный файл.
- Нажмите ПРЕОБРАЗОВАТЬ .
- Введите имя нового файла, если применимо, и нажмите Сохранить.
Устранение неполадок при создании файла .csv
Первым шагом при устранении неполадок с CSV-файлами является просмотр данных CSV в необработанном виде. Мы рекомендуем открывать CSV-файл в текстовом редакторе, таком как Блокнот в Windows или TextEdit в MacOS. Хотя это нелегко читать, если не разделить столбцы и строки, вы сможете определить, какой разделитель использовался, и существует ли проблема с кодировкой символов в CSV-файле.
Если какая-либо из проблем существует, мы предлагаем вам начать с самого начала с создания CSV-файла.
Как правильно генерировать данные в формате CSV
См. ниже советы по программному обеспечению по созданию файлов .csv, но учтите, что настройки вашего компьютера по умолчанию могут оказывать влияние на используемый разделитель.
Настройки вашего компьютера по умолчанию
В зависимости от используемого вами программного обеспечения, а также языковых и региональных настроек вашего компьютера файлы .csv могут создаваться с использованием в качестве разделителя точки с запятой вместо запятой. Итак, первое, что вам нужно сделать, если вы создаете CSV-файлы с помощью программного обеспечения для настольных ПК, — это проверить системные настройки вашего компьютера по умолчанию.
В Windows 10 сделайте следующее:
- Откройте Панель управления Время и язык
- На боковой панели выберите Регион .
- В разделе Связанные настройки справа нажмите Дополнительные настройки даты, времени и региона >Изменить формат даты, времени или числа (ниже Регион ).
- Наконец, нажмите Дополнительные настройки , измените разделитель списка на запятую и убедитесь, что ваш десятичный символ не является запятой. , например точка.
В MacOS сделайте следующее:
- Откройте Системные настройки >Язык и регион
- Нажмите Дополнительно… >Общие
- Для числовых разделителей введите запятую для группировки (мы предлагаем точку для десятичного числа )
Если параметры вашего компьютера по умолчанию настроены правильно, вам нужно сосредоточиться на настройках, характерных для вашего программного обеспечения.
Google Таблицы
Программное обеспечение для работы с электронными таблицами на базе браузера Google, Google Таблицы, вероятно, является самым простым и надежным способом создания совместимых файлов .csv. Если вы используете Google Таблицы, приведенные выше системные настройки по умолчанию не имеют значения, так как релевантные региональные настройки относятся к вашему браузеру. Однако независимо от вашего региона Google Таблицы всегда должны генерировать истинные данные значений, разделенных запятыми, и правильно кодировать специальные символы в формате UTF-8.
Чтобы загрузить электронную таблицу Google Sheets в формате .csv, выберите Файл > Загрузить > Значения, разделенные запятыми .
Майкрософт Эксель
Версия Excel для настольных ПК управляется описанными выше системными настройками по умолчанию как в Windows, так и в MacOS, но вам также потребуется выбрать правильный параметр при создании файлов .csv (как указано выше).
В Microsoft Excel 2016 или более поздней версии выберите Файл > Сохранить как… и в раскрывающемся меню Формат файла выберите CSV-файл UTF-8 . Если вы сделаете это после установки системного разделителя, вы должны получить правильно отформатированный файл .csv.
Если вы используете более раннюю версию Microsoft Office, выберите Файл > Сохранить как… и в раскрывающемся меню Формат файла выберите выберите CSV . Затем вы должны либо 1) открыть CSV-файл в текстовом редакторе, например в Блокноте, и сохранить его с правильной кодировкой (в диалоговом окне Сохранить как нажмите Кодировка раскрывающемся списке и выберите вариант «UTF-8») или 2) используйте SurveyCTO Desktop для повторного кодирования CSV-файла в UTF-8, как указано выше.
LibreOffice
В качестве бесплатной настольной альтернативы Excel вы можете попробовать LibreOffice. В приложении LibreOffice Calc выберите Файл > Сохранить как и выберите параметр "Текст CSV" Тип файла.
Статистика
Если вы работаете с набором данных в Stata, который будет предварительно загруженными данными для формы, вы можете использовать команду экспорта с разделителями, чтобы сохранить набор данных в формате CSV. Эта команда содержит параметры, которые позволяют правильно закодировать CSV-файл (опция encoding()) или указать разделитель (опция delimiters(), groupseparator() и decimalseparator()), если это необходимо. Чтобы получить дополнительные сведения, введите help export delimited.
Другое программное обеспечение
Если вы используете другой программный пакет, не указанный здесь, мы предлагаем вам найти в Google, как создавать файлы .csv с этим программным обеспечением. Скорее всего, это обычный запрос.
Что вы думаете об этой статье поддержки? Мы будем рады их услышать! Не стесняйтесь заполнять эту форму обратной связи.
Читайте также: