В какой форме исходные данные представлены в табличных процессорах

Обновлено: 21.11.2024

Несмотря на то, что были приложены все усилия для соблюдения правил стиля цитирования, могут быть некоторые расхождения. Если у вас есть какие-либо вопросы, обратитесь к соответствующему руководству по стилю или другим источникам.

Наши редакторы рассмотрят то, что вы отправили, и решат, нужно ли пересматривать статью.

электронная таблица, компьютерная программа, которая представляет информацию в виде двумерной сетки данных вместе с формулами, связывающими данные. Исторически электронная таблица — это страница бухгалтерского учета, которая показывает различную количественную информацию, полезную для управления бизнесом. Электронные таблицы заменили рукописные версии в конце 20 века. Однако электронные таблицы не ограничиваются финансовыми данными и часто используются для представления научных данных и выполнения вычислений.

Первой программой для работы с электронными таблицами была VisiCalc, написанная для компьютера Apple II в 1979 году. Для многих пользователей это приложение наиболее наглядно продемонстрировало полезность персональных компьютеров для малого бизнеса. за несколько минут ввода данных. Например, простая электронная таблица может содержать информацию о заработной плате со столбцами для имен и адресов сотрудников, номеров социального страхования, почасовой оплаты, отработанных часов, налоговых вычетов и чистой заработной платы. К ячейкам в последнем столбце может быть прикреплена формула для вычисления оплаты в зависимости от ячеек в трех предыдущих столбцах для каждого сотрудника. В электронной таблице будет показана чистая заработная плата и, по запросу, ее формула. Если бы ставки удержания налога были изменены, все ячейки чистой заработной платы можно было бы легко пересчитать.

Компьютеры размещают веб-сайты, состоящие из HTML, и отправляют текстовые сообщения так же просто, как. РЖУ НЕ МОГУ. Взломайте этот тест, и пусть какая-нибудь технология подсчитает ваш результат и раскроет вам его содержание.

Таблицы также незаменимы при расчетах возможных вариантов. После того как набор формул сгенерировал данные в ячейках электронной таблицы как функции других ячеек, можно поэкспериментировать, изменив один параметр, например цену детали, чтобы проследить его влияние на стоимость продукта. С помощью соответствующих формул прогнозирования можно спрогнозировать рынок продукта и, следовательно, общую прибыль по старой и новой цене. При таком использовании электронные таблицы служат потребностям менеджеров, экономистов и всех, кто работает с отношениями между типами количественной информации.

Поскольку электронные таблицы можно программировать, их также можно использовать для общих вычислений. Они используются для моделирования в науке и технике, а также хорошо подходят для образовательных целей — например, для отображения синтеза звука из простых аудиосигналов. Кроме того, поскольку они представляют собой двумерные сетки ячеек, их можно легко запрограммировать как клеточные автоматы, системы ячеек, состояние которых зависит от состояний их соседей. Простым примером является «Игра жизни» американского математика Джона Х. Конвея, а другие клеточные автоматы могут моделировать сложные физические или биологические процессы.

Сегодня электронные таблицы для персональных компьютеров обычно позволяют преобразовывать данные в различные типы графиков (например, круговые диаграммы и гистограммы) и часто интегрируются с другим программным обеспечением, таким как текстовые процессоры и программы баз данных.

Редакторы Британской энциклопедии Эта статья была недавно отредактирована и обновлена ​​Эриком Грегерсеном.

Электронные таблицы позволяют визуализировать данные разными способами. Одним из наиболее важных способов визуализации данных является построение диаграмм. Диаграммы или графики в электронных таблицах очень просты. Пользователь выбирает данные, которые были нанесены на график, а затем выбирает соответствующие команды либо в меню, либо на панели инструментов. Очень часто удобные мастера помогают пользователю в процессе настройки графика. Эти мастера отображают предварительный просмотр графика, предоставляя пользователям диалоговые окна для управления настройками графика.

Пользователь может выбирать из нескольких типов диаграмм, включая столбцы, столбцы, линии, круговые диаграммы, XY, области, поверхности и пузырьки. Пользователь также может комбинировать некоторые из этих типов графиков. Пользователь может выбрать тип графика, который наиболее эффективно передает природу данных. Например, полезно визуализировать тенденции в данных временных рядов с помощью линейного графика. Графики XY полезны для отображения статистически связанных данных. Круговые диаграммы полезны для визуализации процентных распределений. Некоторые электронные таблицы позволяют даже рисовать трехмерные диаграммы.

Как правило, данные независимых переменных, которые должны быть отображены на горизонтальной оси, указываются как данные X-серии.Данные зависимой переменной (переменных) указываются как ряды данных 1, 2, 3 и т. д. Пользователь может ввести название диаграммы, подзаголовки, названия осей и легенды. Также можно указать шкалы, основные деления, второстепенные деления, порядок данных и расположение заголовков. Сложные программы для работы с электронными таблицами, такие как Excel, позволяют пользователю добавлять линии тренда и выполнять линейную регрессию данных, просто щелкнув правой кнопкой мыши данные диаграммы.

После настройки графика, если пользователь изменяет какие-либо данные на листе, функция мгновенного пересчета электронной таблицы пересчитывает все формулы на листе и обновляет график, чтобы отразить новые значения. Эта возможность позволяет пользователям проводить анализ возможных вариантов и изучать влияние изменений независимых переменных на ряд зависимых переменных, чтобы получить ценную информацию о ситуации. Такие возможности чрезвычайно полезны для принятия обоснованных решений. Рисунок 7 содержит график, созданный с помощью программного обеспечения Microsoft Excel. На нем показана цена акций Amazon Corp. за 3 месяца. Дневные максимумы, минимумы и цены акций на закрытие строятся с использованием биржевого графика.

Рисунок 7. График создан с помощью Excel.

Программирование для конечных пользователей в Интернете

Аллен Сайфер, код не требуется, 2010 г.

Особый случай программирования электронных таблиц

Программисты электронных таблиц — это важная и уникальная подгруппа программистов конечных пользователей. они важны из-за своего размера — по оценкам, более 50 миллионов человек (Scaffidi, Shaw, & Myers, 2005) — и уникальны, потому что они не прочь технические, математические решения. Поскольку электронные таблицы используются для манипулирования числовыми данными, программисты, работающие с электронными таблицами, не боятся математических формул и не боятся абстракции. На рис. 1.5 показаны некоторые типичные формулы электронных таблиц.

Рисунок 1.5. Некоторые типичные формулы электронных таблиц.

Действительно, приложения для работы с электронными таблицами, такие как Microsoft Excel, можно рассматривать как среды программирования, а настраиваемые электронные таблицы, создаваемые пользователями Excel, — как программы. Таким образом, создателям электронных таблиц не нужно время от времени обращаться к возможностям программирования, чтобы улучшить взаимодействие с приложением для работы с электронными таблицами; программирование — основная деятельность при создании электронных таблиц.

Интересно отметить, что весь континуум пользователей электронных таблиц эволюционировал. Бонни Нарди провела основополагающее исследование экологии программирования электронных таблиц в своей книге A Small Matter of Programming (Nardi, 1993), опубликованной в 1993 году. электронных таблиц, от опытных программистов до отдельных лиц, которые используют только электронные таблицы, созданные другими, и не пишут формулы самостоятельно.

Несмотря на феноменальный успех программирования конечных пользователей с помощью электронных таблиц, крайне важно не предполагать, что решения, подходящие для этой аудитории, также будут подходить для обычных конечных пользователей. Меня постоянно пугают исследователи, которые хотят использовать электронные таблицы в качестве парадигмы для всех классов программистов конечных пользователей.

Тем не менее, в области электронных таблиц проводятся значительные исследования, которые, вероятно, применимы ко всем типам программирования для конечных пользователей. В частности, работа Маргарет Бернетт над стратегией «Удивление-объяснение-вознаграждение» как метода мотивации программистов-конечных пользователей к тестированию своих программ для работы с электронными таблицами, вероятно, будет эффективна и для веб-программирования для конечных пользователей (Wilson et al., 2003). ).

SPSS (статистический пакет для социальных наук)

III.С. SPSS и программы для работы с электронными таблицами

Программы для работы с электронными таблицами, такие как Lotus 1-2-3, Microsoft Excel и Quattro, позволяют пользователям систематизировать большие наборы данных в виде электронных таблиц. Ранние версии программного обеспечения для работы с электронными таблицами были разработаны для бухгалтерских приложений и были просты по своим возможностям. В более новых версиях их возможности расширены, включая основные функции описательной статистики.

Обычно программы для работы с электронными таблицами позволяют пользователям вводить и сохранять числовые данные в больших форматах листов. Эти рабочие листы, похожие по внешнему виду и функциям на редактор данных SPSS, имеют дополнительную возможность вставлять уравнения в рабочий лист. Эти уравнения используются для выполнения вычислений между ячейками и внутри них. SPSS – это полнофункциональная программная система, более сложная и комплексная, чем программа для работы с электронными таблицами.

Практическое руководство по управлению данными и интеграции данных в биоинформатике

Барбара А. Экман, Биоинформатика, 2003 г.

Таблицы

Электронные таблицы просты в использовании и удобны для отдельных исследователей, чтобы быстро просматривать свои данные, выполнять простые арифметические операции и передавать их коллегам.Организация электронной таблицы на основе ячеек позволяет структурировать данные в отдельные элементы, по которым затем можно сортировать электронную таблицу. Программное обеспечение для работы с электронными таблицами Microsoft Excel [ 9 ] предоставляет удобные функции ввода данных для репликации значений в нескольких ячейках, заполнения последовательности строк последовательностью целочисленных идентификаторов и ввода значений в ячейку, которые ранее появлялись в том же столбце.

Недостаток электронных таблиц, по крайней мере в том виде, в котором они обычно используются, заключается в том, что при вводе данных выполняется очень небольшая проверка данных. Безусловно, с помощью программирования на Microsoft Visual Basic или с помощью расширенных функций Excel можно выполнить проверку ограничений, например, убедиться, что значения данных были взяты из утвержденного списка значений или контролируемого словаря, что числовые данные попадает в правильный диапазон или что конкретная ячейка не осталась пустой; но на практике это делается не часто. Кроме того, несмотря на то, что для решения этой проблемы существуют расширенные функции, на практике электронные таблицы обычно содержат большое количество повторяющихся или избыточных данных. Например, электронная таблица данных экспрессии гена может включать следующую информацию, повторяющуюся для каждого образца ткани, с которым тестировался ген: регистрационный номер GenBank, имя гена, описание гена, идентификатор локуса LocusLink и идентификатор кластера UniGene. Если в каком-либо из этих избыточных полей будет обнаружена ошибка, изменение должно быть сделано в каждой строке, соответствующей рассматриваемому гену. Если изменение не внесено во все соответствующие строки, в данных возникает несогласованность. В кругах баз данных это несоответствие, вызванное ненужным дублированием данных, называется аномалией обновления.

Еще одна проблема с электронными таблицами заключается в том, что они, по сути, являются источниками данных для одного пользователя. Только один пользователь может вводить данные в электронную таблицу одновременно. Если несколько пользователей должны вносить данные в источник данных, размещенный в электронной таблице, должен быть назначен один куратор. Если было распространено несколько копий электронной таблицы, и каждая из них редактировалась и добавлялась другим куратором, согласование разногласий между версиями будет серьезной задачей, когда желательна единая каноническая версия. Сама таблица в этом вопросе ничем помочь не может.

Наконец, методы поиска по данным, хранящимся в электронных таблицах, ограничены простым текстовым поиском по всей электронной таблице; сложные комбинации условий поиска, такие как «возврат рецепторов серотонина, которые имеют SNP, но не имеют результатов экспрессии генов», не допускаются. Дополнительные ограничения текстового поиска представлены в следующем разделе.

Любой файл, содержащий данные, считается источником данных

Ребекка Джонсон — бывший внештатный сотрудник Lifewire и сертифицированный мастер-инструктор Microsoft Office, специализирующийся на продуктах Microsoft Office.

Источник данных (иногда называемый файлом данных) – это место, из которого берутся данные. Источником могут быть любые данные в любом формате файла, если программа понимает, как их читать.

Важные факты об источниках данных

Источник данных, также называемый файлом данных, представляет собой набор записей, в которых хранятся данные. Источником данных может быть любой документ, организованный таким образом, чтобы предоставить принимающей программе структуру для извлечения данных. В качестве источника данных можно использовать любой текстовый файл, например обычный текстовый файл или файл базы данных.

Текстовый файл может быть получен из таких программ, как Microsoft Access и FileMaker Pro. Теоретически в качестве источника данных можно использовать любую базу данных Open Database Connectivity (ODBC). Вы также можете создать файл в электронных таблицах из Excel, Quattro Pro и подобных программ. Источником данных также может быть простая таблица в документе текстового процессора.

Различные приложения могут использовать источник данных, в том числе приложения баз данных, такие как Microsoft Access, Microsoft Excel и другие программы для работы с электронными таблицами, текстовые процессоры, такие как Microsoft Word, веб-браузеры и автономные программы.

Файл источника данных, используемый в одной программе для одной цели, может быть неприменим в другой программе, даже если обе программы используют файлы источника данных. Другими словами, конкретный источник данных зависит от приложения, использующего данные.

Примеры источников данных

Типичный сценарий, когда Microsoft Word использует источник данных, заключается в том, что Word выполняет слияние почты из данных, взятых из документа Excel. Например, источником данных для слияния почты в Microsoft Word может быть файл CSV. Этот файл содержит контакты, которые можно автоматически записать в документ Word для печати конвертов с правильными именами и адресами. Однако такой источник данных может оказаться бесполезным в другом контексте.

Другим источником данных может быть файл, в котором записано время посещения врача.Программа может использовать источник данных для агрегирования всех случаев регистрации и отображения времени на веб-сайте или для использования информации в приложении либо для просмотра содержимого, либо для взаимодействия с другим источником данных.

В некоторых сценариях можно использовать контакт из адресной книги, поскольку есть столбец для имени, адреса и учетной записи электронной почты.

Источники данных также могут поступать из прямой трансляции. Например, iTunes может использовать прямую трансляцию для воспроизведения интернет-радиостанций. Фид — это источник данных, а приложение iTunes — это то, что отображает фид.

Чтобы изменить источник данных сводной таблицы Excel, перейдите на вкладку "Анализ" и выберите "Изменить источник данных" > "Изменить источник данных". Затем выберите таблицу или диапазон и нажмите "ОК".

«Непривязанная форма» в Microsoft Access — это форма, которая не привязана к какой-либо таблице базы данных или запросу. Однако он по-прежнему может содержать команды, метки или другие элементы управления для управления приложением.

1. Введение

Таблицы, несмотря на всю их приземленную прямоугольность, уже несколько десятилетий являются предметом беспокойства и споров. Некоторые авторы предостерегают, что «настоящие программисты не используют электронные таблицы» и что мы должны «остановить эти подрывные электронные таблицы» (Casimir 1992; Chadwick 2003). Другие советуют исследователям, как использовать электронные таблицы для повышения их производительности (Wagner and Keisler 2006). В ходе этих дебатов электронные таблицы продолжают играть важную роль в рабочих процессах исследователей, и становится ясно, что они являются ценным инструментом, от которого исследователи вряд ли полностью откажутся.

Таблицы часто используются как универсальный инструмент для ввода, хранения, анализа и визуализации данных. Большинство программ для работы с электронными таблицами позволяют пользователям выполнять все эти задачи, однако мы считаем, что электронные таблицы лучше всего подходят для ввода и хранения данных, а анализ и визуализация должны выполняться отдельно. Анализ и визуализация данных в отдельной программе или, по крайней мере, в отдельной копии файла данных снижает риск загрязнения или уничтожения необработанных данных в электронной таблице.

Муррелл (2013 г.) сравнил данные, отформатированные для просмотра человеком, с данными, отформатированными для компьютера. Он предоставил расширенный пример компьютерного кода для извлечения данных из набора файлов со сложным расположением. Важно, чтобы аналитики данных могли работать с такими сложными файлами данных. Но если первоначальная компоновка файлов данных планируется с учетом компьютера, последующий процесс анализа упрощается.

В этой статье мы предлагаем практические рекомендации по организации данных электронных таблиц таким образом, чтобы их могли читать как люди, так и компьютерные программы. Следуя этому совету, исследователи будут создавать электронные таблицы, которые менее подвержены ошибкам, их легче обрабатывать на компьютерах и которыми легче делиться с коллегами и общественностью. Электронные таблицы, соответствующие нашим рекомендациям, будут хорошо работать с аккуратными инструментами и воспроизводимыми методами, описанными в других разделах этой коллекции, и станут основой надежного и воспроизводимого аналитического рабочего процесса.

Для существующего набора данных, расположение которого можно было бы улучшить, мы не рекомендуем применять утомительное и потенциально чреватое ошибками ручное редактирование для пересмотра расположения. Скорее, мы надеемся, что читатель сможет применить эти принципы при разработке макета для будущих наборов данных.

2. Будьте последовательны

Первое правило организации данных — быть последовательным. Что бы вы ни делали, делайте это последовательно. Последовательный ввод и систематизация данных с самого начала избавит вас и ваших сотрудников от необходимости тратить время на согласование данных позже.

Используйте согласованные коды для категориальных переменных. Для категориальной переменной, такой как пол мыши в генетическом исследовании, используйте одно общее значение для самцов (например, «самец») и одно общее значение для женщин (например, «женщина»). Не пишите иногда «М», иногда «мужской», а иногда «мужской». Выберите один и придерживайтесь его.

Используйте согласованный фиксированный код для всех отсутствующих значений. Мы предпочитаем заполнять каждую ячейку, чтобы можно было отличить действительно отсутствующие значения от непреднамеренно отсутствующих значений. Пользователи R предпочитают «NA». Вы также можете использовать дефис. Но придерживайтесь единого значения во всем. Определенно не используйте числовое значение, такое как -999 или 999; легко упустить из виду, что он предназначен для отсутствия. Также не стоит вместо данных вставлять примечание, объясняющее, почему оно отсутствует. Лучше сделайте с такими заметками отдельную колонку.

Используйте согласованные имена переменных. Если в одном файле (например, в первой группе предметов) у вас есть переменная с именем «Глюкоза_10 нед», назовите ее точно так же, как и в других файлах (например, для другие группы предметов). Если он по-разному называется «Глюкоза_10 недель», «глюк_10 недель» и «Глюкоза за 10 недель», то нижестоящему аналитику данных придется выяснить, что на самом деле это одно и то же.

Используйте согласованные идентификаторы субъектов. Если иногда это «153», иногда «мышь153», иногда «мышь-153F», а иногда «Мышь153», потребуется дополнительная работа, чтобы выяснить, кто есть кто.

Используйте согласованный макет данных в нескольких файлах. Если ваши данные находятся в нескольких файлах и вы используете разные макеты в разных файлах, аналитику потребуется дополнительная работа по объединению файлов в один набор данных. для анализа. При согласованной структуре этот процесс будет легко автоматизировать.

Используйте согласованные имена файлов. Разработайте систему именования файлов. Если один файл называется «Serum_batch1_2015-01-30.csv», то не называйте файл для следующего пакета «batch2_serum_52915.csv», а используйте «Serum_batch2_2015-05-29.csv». Соблюдение согласованной схемы именования файлов поможет обеспечить правильную организацию файлов и упростит пакетную обработку файлов, если это необходимо.

Используйте в своих заметках согласованные фразы. Если у вас есть отдельный столбец заметок (например, «мертвые» или «вне кривой»), будьте последовательны в том, что вы пишете. Не пишите иногда "мертвый", а иногда "мертвый" или иногда "вне кривой", а иногда "вне кривой ло".

Будьте осторожны с лишними пробелами внутри ячеек. Пустая ячейка отличается от ячейки, содержащей один пробел. А «мужской» отличается от «мужской» (т. е. пробелами в начале и в конце).

3. Выбирайте хорошие названия для вещей

Важно выбирать для вещей хорошие названия. Это может быть сложно, поэтому стоит потратить на это время и подумать.

Как правило, не используйте пробелы ни в именах переменных, ни в именах файлов. Они усложняют программирование: аналитику нужно будет заключать все в двойные кавычки, например «глюкоза 6 недель», а не просто писать «глюкоза_6_недель». Там, где вы можете использовать пробелы, используйте символы подчеркивания или, возможно, дефисы. Но не используйте смесь подчеркиваний и дефисов; выберите один и будьте последовательны.

Остерегайтесь лишних пробелов в начале или конце имени переменной. «глюкоза» отличается от «глюкозы» (лишним пробелом в конце).

Читайте также: