Файлы каких типов можно использовать в качестве источника данных

Обновлено: 03.07.2024

Вы можете сохранить свою работу, используя несколько различных типов файлов Tableau: книги, закладки, упакованные файлы данных, извлечения данных и файлы подключения к данным. Каждый из этих типов файлов описан ниже. Дополнительные сведения см. в разделе «Сохраните свою работу».

Рабочие книги (.twb). Файлы рабочих книг Tableau имеют расширение .twb. Книги содержат один или несколько рабочих листов, а также ноль или более информационных панелей и историй.

Закладки (.tbm). Файлы закладок Tableau имеют расширение .tbm. Закладки содержат один рабочий лист и представляют собой простой способ быстро поделиться своей работой. Дополнительную информацию см. в разделе Сохранение закладки (ссылка открывается в новом окне) .

Упакованные книги (.twbx). Упакованные книги Tableau имеют расширение .twbx. Упакованная рабочая книга — это один ZIP-файл, содержащий рабочую книгу вместе со всеми вспомогательными локальными файлами данных и фоновыми изображениями. Этот формат — лучший способ упаковать вашу работу, чтобы поделиться ею с другими, у которых нет доступа к исходным данным. Дополнительные сведения см. в разделе Упакованные книги.

Extract (.hyper или .tde) — в зависимости от версии, в которой был создан экстракт, файлы извлечения Tableau могут иметь расширение .hyper или .tde. Файлы извлечения — это локальная копия подмножества или всего набора данных, которые вы можете использовать для обмена данными с другими, когда вам нужно работать в автономном режиме, и для повышения производительности. Дополнительную информацию см. в разделе Извлечение данных.

Источник данных (.tds). Файлы источников данных Tableau имеют расширение .tds. Файлы источников данных — это ярлыки для быстрого подключения к исходным данным, которые вы часто используете. Файлы источников данных содержат не фактические данные, а информацию, необходимую для подключения к фактическим данным, а также любые изменения, которые вы сделали поверх фактических данных, такие как изменение свойств по умолчанию, создание вычисляемых полей, добавление групп и т. д. на. Дополнительные сведения см. в разделе Сохранение источников данных.

Упакованный источник данных (.tdsx) — файлы упакованных источников данных Tableau имеют расширение .tdsx. Упакованный источник данных — это ZIP-файл, который содержит файл источника данных (.tds), описанный выше, а также любые данные локального файла, такие как файлы извлечения (.hyper или .tde), текстовые файлы, файлы Excel, файлы Access и локальные файлы. кубические файлы. Используйте этот формат для создания единого файла, которым вы сможете поделиться с другими пользователями, у которых может не быть доступа к исходным данным, хранящимся локально на вашем компьютере. Дополнительные сведения см. в разделе Сохранение источников данных.

Эти файлы можно сохранить в связанных папках в каталоге My Tableau Repository, который автоматически создается в папке My Documents при установке Tableau. Ваши рабочие файлы также можно сохранять в других местах, например на рабочем столе или в сетевом каталоге.

Изменение местоположения репозитория

Вы можете указать новое расположение для репозитория Tableau, если вы не используете расположение по умолчанию в папке «Документы». Например, если вам необходимо хранить данные на сетевом сервере, а не на локальном компьютере, вы можете указать Tableau в удаленном хранилище.

Выберите «Файл» > «Расположение репозитория».

Выберите новую папку, которая будет использоваться в качестве нового местоположения репозитория, в диалоговом окне «Выбор репозитория».

Перезапустите Tableau, чтобы использовать новый репозиторий.

При изменении местоположения репозитория файлы, содержащиеся в исходном репозитории, не перемещаются. Вместо этого Tableau создает новый репозиторий, в котором вы можете хранить свои файлы.

Любой файл, содержащий данные, считается источником данных

Ребекка Джонсон — бывший внештатный сотрудник Lifewire и сертифицированный мастер-инструктор Microsoft Office, специализирующийся на продуктах Microsoft Office.

Источник данных (иногда называемый файлом данных) – это место, из которого берутся данные. Источником могут быть любые данные в любом формате файла, если программа понимает, как их читать.

Важные факты об источниках данных

Источник данных, также называемый файлом данных, представляет собой набор записей, в которых хранятся данные. Источником данных может быть любой документ, организованный таким образом, чтобы предоставить принимающей программе структуру для извлечения данных. В качестве источника данных можно использовать любой текстовый файл, например обычный текстовый файл или файл базы данных.

Текстовый файл может быть получен из таких программ, как Microsoft Access и FileMaker Pro. Теоретически в качестве источника данных можно использовать любую базу данных Open Database Connectivity (ODBC). Вы также можете создать файл в электронных таблицах из Excel, Quattro Pro и подобных программ. Источником данных также может быть простая таблица в документе текстового процессора.

Различные приложения могут использовать источник данных, в том числе приложения баз данных, такие как Microsoft Access, Microsoft Excel и другие программы для работы с электронными таблицами, текстовые процессоры, такие как Microsoft Word, веб-браузеры и автономные программы.

Файл источника данных, используемый в одной программе для одной цели, может быть неприменим в другой программе, даже если обе программы используют файлы источника данных.Другими словами, конкретный источник данных зависит от приложения, использующего данные.

Примеры источников данных

Типичный сценарий, когда Microsoft Word использует источник данных, заключается в том, что Word выполняет слияние почты из данных, взятых из документа Excel. Например, источником данных для слияния почты в Microsoft Word может быть файл CSV. Этот файл содержит контакты, которые можно автоматически записать в документ Word для печати конвертов с правильными именами и адресами. Однако такой источник данных может оказаться бесполезным в другом контексте.

Другим источником данных может быть файл, в котором записано время посещения врача. Программа может использовать источник данных для агрегирования всех случаев регистрации и отображения времени на веб-сайте или для использования информации в приложении либо для просмотра содержимого, либо для взаимодействия с другим источником данных.

В некоторых сценариях можно использовать контакт из адресной книги, поскольку есть столбец для имени, адреса и учетной записи электронной почты.

Источники данных также могут поступать из прямой трансляции. Например, iTunes может использовать прямую трансляцию для воспроизведения интернет-радиостанций. Фид — это источник данных, а приложение iTunes — это то, что отображает фид.

Чтобы изменить источник данных сводной таблицы Excel, перейдите на вкладку "Анализ" и выберите "Изменить источник данных" > "Изменить источник данных". Затем выберите таблицу или диапазон и нажмите "ОК".

«Непривязанная форма» в Microsoft Access — это форма, которая не привязана к какой-либо таблице базы данных или запросу. Однако он по-прежнему может содержать команды, метки или другие элементы управления для управления приложением.

Информация есть везде, и очень важно уметь определять ее достоверность. Хотя некоторые источники информации носят качественный характер, подавляющее большинство сегодня основано на данных. А когда речь идет о данных, источником информации является цифровое место хранения. Это место хранения называется источником данных.

В этой статье рассказывается, что такое источник данных, его различные типы и распространенные примеры. Это кульминация первичного и вторичного исследования. В дополнение к моему опыту аналитика методология заключалась в изучении использования термина «источник данных» (1) в технической среде, такой как документация базы данных, и (2) в финансах и публикациях данных. Эти точки зрения обеспечивают комплексную оценку термина.

Краткий ответ: что такое источник данных?

Короче говоря, источник данных — это физическое или цифровое место, где данные хранятся в виде таблицы данных, объекта данных или другого формата хранения.

Полное разрешение

Впервые вы услышали термин "источник данных" в юности на уроке естествознания. В то время «источником», скорее всего, была таблица средних значений, созданная из большого набора данных. Легко понять, почему мы называем это источником — мы видим, откуда поступает информация. Но действительно ли это то, что мы подразумеваем под источником данных?

Возможно, вы также слышали словосочетание «источник данных» в контексте проверки фактов. Когда вы читаете статью со ссылками на цифры, вы можете спросить, кто является источником, например блогом или правительственным веб-сайтом. В этом контексте вы ищете авторитет, а не сами данные. Но мы используем одно и то же слово: источник данных!

Это не единственные два примера. Под заголовком «Типы источников данных» ниже я рассмотрю 8 различных уровней, на которых мы используем этот термин. Чтобы установить полное определение, нам нужны эти 8 уровней.

Мы также можем назвать их 8 контекстами, в которых мы слышим этот термин. Представьте, что я говорю: «Он работает?» говорите о кране, но вы смотрите журнал под названием «Бег». Мы запутаемся. С «источником данных» часто та же самая идея.

Очень подробное определение, включающее 8 уровней, будет следующим:

Источником данных является
(1) физическое или цифровое место, где данные хранятся в виде таблицы данных (или в другом формате),
(2) степень оригинальности таблицы данных. ,
(3) поставщик данных о торговой марке
(4) данные, используемые с помощью инструмента самообслуживания, такого как Excel, Tableau или Power BI,
(5) хранилище компьютера тип, т. е. файловый источник данных или машинный источник данных,
(6) техническая база данных, такая как Amazon AWS или Microsoft Azure
(7) устаревший источник данных с собственным именем в организации,
>(8) тип данных, например биржевой, бухгалтерский или экономический индикатор.

«Источник данных» и «Источник данных»

Однако слова «данные» и «источник» существуют во всех словарях. Это означает, что правильное написание термина состоит из двух слов, что делает «источник данных» открытым составным словом.

Типы источников данных

Как обсуждалось в нашем разделе полного определения, различные типы источников данных зависят от контекста. Чтобы компенсировать разнообразие и создать удобоваримую информацию, я выделил 8 уровней, на которых часто встречается слово «источник данных».Я использую слово «уровень», потому что мы можем думать об этом как об «уровнях детализации».

1. Уровень таблицы данных

Основное взаимодействие с источниками данных осуществляется на уровне таблицы данных. Таблица данных — это не что иное, как столбцы и строки. Каждая строка содержит идентификатор и записи в каждом столбце, описывающем строку, тогда как каждый столбец содержит все записи для каждого идентификатора в конкретном описателе для этого столбца. В моей статье о наборах данных я объясняю это с помощью следующей таблицы-примера:

Если кто-то спросит: "Какой источник данных нам нужен?" Если вопрос задан на уровне типа данных, ответ может быть таким: акции, экономика, Земля, здоровье и т. д.

Имя источника данных (DSN)

Вышеупомянутые уровни в некоторых отношениях могут показаться размытыми. Термин «источник данных», по-видимому, применяется к уровням с разной «интенсивностью». Это правда, и это реальность. Термин сильно зависит от контекста.

Однако одно остается неизменным. Табличные данные на любом из вышеперечисленных уровней имеют имя источника данных (DSN). DSN — это файл (существующий в нескольких различных форматах), который содержит необходимую информацию, необходимую для подключения к источнику цифровых данных. Важно отметить, что он содержит имя целевой таблицы данных. DSN используется практически во всех случаях цифровых данных.

Примечание относительно бумажных источников данных

Мы много говорили о цифровых источниках данных, но бумажные источники данных существуют и сегодня. Например, большая часть данных, используемых для анализа исторических событий, хранится на бумаге. В рамках европейского правительства есть обширные проекты по преобразованию этих данных в цифровые, но пока источником действительно является бумага.

Например, если вы хотите узнать среднюю длину книг, изданных в Германии в 1890-х годах, в словесном выражении, ваши исходные данные – бумажные, а не цифровые. Даже когда все эти книги будут переведены в цифровой формат, основным источником данных останется бумага.

Использование источника данных: аналитика и операции

Большая часть нашего опыта работы с источниками данных связана с аналитикой, но на самом деле чаще всего используются автоматизированные операции. Все действующие ИТ-системы автоматически выполняют непрерывные запросы к базам данных. Как люди, мы не видим эти системы, но они составляют подавляющее большинство экземпляров источников данных.

Когда мы думаем об источниках данных, мы должны помнить, что это не только те, которые мы видим, но и практически все системы, которые мы не видим.

Источник данных в Terraform

Terraform – это программное обеспечение, работающее по принципу "инфраструктура как код", и один из часто задаваемых вопросов – как работают источники данных.

Как описывает сама Terraform, «доступ к источнику данных осуществляется через особый тип ресурса, известный как ресурс данных, объявленный с помощью блока данных 1 :

Если вы не являетесь разработчиком, специализирующимся на этом языке, вам, вероятно, не нужно знать его подробно, поэтому мы остановимся на этом.

Заключение

Источник данных — сложный термин. Его использование в 8 различных контекстах делает его интересным для определения. Проще говоря, источник данных — это физическое или цифровое место, где данные хранятся в виде таблицы данных, объекта данных или другого формата хранения.

Источники данных на основе файлов для моделей данных обычно представляют собой «локальные» файлы, которые пользователь хочет либо смоделировать напрямую, либо включить для украшения настроенных источников данных. Источники данных на основе файлов не требуют предварительной настройки и имеют несколько ограничений для бизнес-пользователей.

К исходным файлам относятся файлы Excel, Access и текстовые файлы. Он также включает файлы Excel, содержащие модели PowerPivot, которые будут использоваться для непосредственного создания модели.

Использование файлового источника данных

Чтобы добавить файл, выберите тип файла, а затем нажмите кнопку добавления на правой панели (выделена синим цветом ниже)


В небольшом всплывающем диалоговом окне вам будет предложено либо импортировать файл в BI Office (фиолетовая стрелка ниже), либо сослаться на файл на общем сетевом диске (красная стрелка).

ПРИМЕЧАНИЕ. Если вы загрузите файл, он будет загружаться частями, и может потребоваться некоторое время, пока он загружается через Интернет. Администратор также устанавливает ограничение на размер загружаемого файла.

Вы можете добавить столько источников файлов в одну модель, сколько необходимо. Если файл основан на тексте, вам может потребоваться предоставить дополнительные данные о том, как следует анализировать текстовый файл при обработке в модели. Подробнее о текстовых файлах см. ниже.


Общие источники файловых данных

Общие файлы предлагают интересную возможность импорта источников данных на основе файлов. Вместо статической загрузки файла в BI Office пользователь предоставляет указатель на его местоположение в сети. Когда модель обрабатывается, файл считывается и включается в модель.Это дает возможность файловым моделям автоматически обновляться новыми данными, когда модель настроена на автоматическое обновление в BI Office, путем простой замены источника в его сетевом расположении обновленным файлом.

ВАЖНО: Общий файл должен использовать формат пути файла «UNC» к общему каталогу и файлу в сети. Каталог также должен быть виден как компьютерам, на которых размещается BI Office, так и табличному экземпляру SSAS. Нажмите "Проверить путь", чтобы убедиться в правильности формата.


Текстовые файлы

После загрузки файла появится мастер "Загрузчик текста".


Мастер автоматически выберет разделитель (обведен оранжевым). Если выбор неверен, вы можете вручную выбрать другой. (Разделитель — это символ в тексте, который разделяет данные.)

Установите флажок (обозначенный синей стрелкой), чтобы сделать первую строку текста заголовком.

Мастер автоматически выберет настройки кодировки и региональных параметров, но вы можете настроить их в дополнительных настройках (красная стрелка). Нажмите кнопку «Дополнительные настройки», чтобы открыть всплывающее окно (см. ниже), в котором вы можете вручную изменить настройки.


PowerPivot

Загрузчик PowerPivot является частью модели данных, поскольку он позволяет конечным пользователям брать свои собственные данные, в данном случае электронные таблицы PowerPivot Excel, и «обновлять» их до табличных кубов, размещенных на сервере таблиц SQL Server 2012/14/16. . Обновление дает следующие преимущества:

  • Затем табличные кубы можно вводить и анализировать в BI Office.
  • Табличные кубы будут работать на более мощной инфраструктуре. (Как правило, серверы более мощные, чем настольные компьютеры.)

Аналитика BI Office предоставляет мощные возможности и возможность обмена контентом между группой пользователей или предприятием в целом. BI Office можно использовать для бизнес-аналитики самообслуживания и корпоративной бизнес-аналитики без изменения технологий, клиентских инструментов или инфраструктуры.

Файлы PowerPivot не могут использовать функцию общего источника файлов из-за ограничений в службах SSAS.

Файлы PowerPivot нельзя комбинировать с другими файлами в процессе моделирования, поскольку они уже представляют завершенный проект модели и ее данные.

После загрузки файла PowerPivot этапы таблицы, столбца, взаимосвязи и иерархии пропускаются. Вместо этого пользователи отправляются на этапы настройки безопасности и финализации для завершения процесса импорта.

Получатели слияния обычно поступают из списка имен и данных в существующем списке, таком как электронная таблица Excel или список контактов Outlook. Существующий список также может быть любой базой данных, к которой вы можете подключиться. Если у вас еще нет списка, вы можете ввести его в Word в процессе слияния.

Список или база данных называется источником данных для слияния.

Выберите тип списка, который вы собираетесь использовать в качестве источника данных:

Новый список

Если у вас еще нет источника данных, выберите «Тип нового списка», а затем используйте открывшуюся форму для создания списка. Список сохраняется в виде файла базы данных (.mdb), который можно использовать повторно.

Подробнее о создании нового списка см. в разделе Настройка нового списка рассылки с помощью Word.

Существующий список

Существующий список может быть электронной таблицей Excel, базой данных Access или базой данных другого типа. Чтобы использовать его в качестве источника данных, выберите «Использовать существующий список».

Электронная таблица Excel Электронная таблица Excel хорошо работает в качестве источника данных для слияния, если все данные правильно отформатированы и размещены на одном листе, чтобы их можно было прочитать в Word. Дополнительные сведения см. в статье Подготовка источника данных Excel для слияния почты Word.

База данных Access С помощью Access вы можете выбирать данные из любой таблицы или запроса, определенных в базе данных. Дополнительные сведения см. в статье Использование слияния для отправки данных Access в Word.

Другие файлы базы данных. Чтобы получить доступ к другим типам источников данных, запустите мастер подключения данных:

Перейдите в раздел «Рассылки» > «Выбрать получателей» > «Использовать существующий список», затем выберите «Новый источник», чтобы открыть мастер подключения данных.

источник данных слияние почты

Выберите тип источника данных, который вы хотите использовать для слияния, и нажмите кнопку Далее.

Подключение данных Волшебник

Следуйте инструкциям мастера подключения данных, чтобы завершить подключение данных к документу слияния.

Список контактов Outlook

Информацию о контактах можно получить непосредственно из списка контактов Outlook в Word. Чтобы использовать его в качестве источника данных, выберите «Выбрать из контактов Outlook». Дополнительные сведения см. в статье Использование контактов Outlook в качестве источника данных для слияния.

Новый список

Если у вас еще нет источника данных, выберите «Создать новый список», а затем используйте открывшиеся диалоговые окна для создания списка. Список сохраняется в виде файла документа, который можно использовать повторно.

Подробнее о создании нового списка см. в разделе Настройка нового списка рассылки с помощью Word.

Существующие источники данных

Вот несколько примеров источников данных, которые можно использовать для слияния почты в Word.

Таблица Excel

Электронная таблица Excel хорошо подходит в качестве источника данных для слияния. Данные должны быть на одном листе и хорошо отформатированы, чтобы их можно было легко прочитать в Word. Дополнительные сведения см. в статье Подготовка источника данных Excel для слияния.

Список контактов Outlook

Вы можете получить контактную информацию непосредственно из списка контактов Outlook в Word. См. раздел Экспорт элементов Outlook.

Список контактов Apple

Вы можете экспортировать контакты Apple в электронную таблицу Excel и использовать ее в качестве списка рассылки для слияния.

Можно использовать любой текстовый файл, в котором поля данных разделены (или разделены) символами табуляции или запятыми, а записи данных разделены знаками абзаца.

• Создать новый список

В диалоговом окне "Редактировать поля списка" Word автоматически создает поля для некоторых основных сведений, таких как имя, фамилия и адрес. Если вы хотите добавить новое поле, например поле сообщения, добавьте его сейчас, чтобы вы могли заполнить поле при вводе записи.

В разделе Имя нового поля введите имя поля, которое вы хотите добавить, а затем нажмите + (знак плюса).

Совет. Чтобы изменить порядок полей, выберите поле, которое нужно переместить, а затем используйте стрелки вверх или вниз, чтобы переместить поле.

Когда все поля настроены так, как вы хотите, нажмите «Создать», чтобы создать новый список.

• Использовать существующий список

Перейдите к файлу, который хотите использовать, и выберите "Открыть".

В диалоговом окне "Открыть книгу" выберите лист, который хотите использовать, а затем выполните одно из следующих действий:

Оставьте поле Cell Range пустым, чтобы использовать весь лист.

Введите диапазон ячеек для данных, которые вы хотите использовать.

• Выберите из контактов Outlook

Выберите «Фильтровать получателей», чтобы выбрать получателей, которых вы хотите включить.

В диалоговом окне "Параметры запроса" рядом с полем Список получателей слияния выберите "Полная запись".

В списке контактов выберите контакты, которые вы хотите включить в слияние, и нажмите кнопку ОК.

• Контакты Apple

Выберите «Фильтровать получателей», чтобы выбрать получателей, которых вы хотите включить.

В диалоговом окне "Параметры запроса" в разделе "Контакты группы Apple" выберите группу, которую хотите включить в слияние, и нажмите кнопку "ОК".

• Мастер создания файлов Pro

Перейдите к файлу, который хотите использовать, и выберите "Открыть".

В диалоговом окне "Разделители записей заголовка" выберите разделитель полей для разделения каждого поля данных и разделитель записей для разделения каждой записи данных, а затем нажмите кнопку "ОК".

Вот несколько примеров источников данных, которые можно использовать для слияния почты в Word.

Таблица Excel

Электронная таблица Excel хорошо работает в качестве источника данных для слияния, если все данные находятся на одном листе и данные правильно отформатированы, чтобы их можно было легко прочитать в Word. Дополнительные сведения см. в разделе Подготовка источника данных Excel для слияния

.

Список контактов Outlook

Вы можете получить контактную информацию непосредственно из списка контактов Outlook в Word, см. раздел Экспорт элементов Outlook .

Список контактов Apple

Вы можете экспортировать контакты Apple в электронную таблицу Excel и использовать ее в качестве списка рассылки для слияния.

Можно использовать любой текстовый файл, в котором поля данных разделены (или разделены) символами табуляции или запятыми, а записи данных разделены знаками абзаца.

Читайте также: