Как открыть файл в r

Обновлено: 21.11.2024

Блог, посвященный исследованиям климата и окружающей среды, использованию R для анализа данных, науки о данных и ГИС.

Страницы (рабочий стол)

Страницы (мобильные)

Краткое руководство по открытию файлов в R

В R есть множество полезных, но малоизвестных функций, которые могут немного облегчить жизнь. Являясь частью серии «кратких руководств», в этом кратком руководстве рассматривается открытие файлов из R — больше не нужно открывать проводник и искать этот файл!

Справочная информация

Открытие файлов из R

R имеет встроенные функции, которые позволяют вам взаимодействовать с основной операционной системой, расширяя функциональные возможности R, позволяя вам выполнять любую системную команду из консоли R. Одним из таких приложений является открытие файлов из консоли R.

Почему это может быть полезно, спросите вы? Ну, скажем, вы только что создали файл в R (например, сохранение графика в формате pdf или запись файла csv вашего фрейма данных) и вы хотите проверить, что файл был создан правильно, или вы хотите увидеть как получился ваш сюжет.

После записи файла вы обычно можете запустить проводник (или средство поиска, или файлы), чтобы найти свое творение и открыть его. Но это требует нескольких щелчков мышью и требует времени! Вместо этого вы можете просто написать простую строку кода.

То, как вы это сделаете, зависит от вашей операционной системы, и для этих примеров мы создадим график, сохраним его в формате PDF, а затем откроем прямо из консоли R.

теги должны быть в первой и последней строке -->

Этот код создаст файл PDF, содержащий график под названием «plot1.pdf», который будет сохранен в текущем рабочем каталоге R.

Чтобы открыть файл из R, ознакомьтесь с соответствующим разделом для вашей операционной системы.

Окна

Чтобы открыть файл графика в системах Windows, необходимо использовать функцию оболочки и указать имя файла. Например:

теги должны быть в первой и последней строке -->

Дополнительный аргумент wait=FALSE указывает R не ждать, пока вы начнете взаимодействовать с консолью R, т. е. он продолжит то, что делает. Если вы опустите этот аргумент (значение по умолчанию — TRUE), R прекратит выполнение команд до тех пор, пока вы не взаимодействуете с консолью.

Приведенный выше код предполагает, что файл, который вы хотите открыть, находится в текущем рабочем каталоге R. Если файл находится в другом месте, вам нужно указать R, где его найти.

Например, если вы хотите открыть CSV-файл с именем "data.csv", который находится в папке с документами, вы можете использовать следующий код (изменив расположение файла для вашей системы):

теги должны быть в первой и последней строке -->

Помните, что вам нужно использовать прямую косую черту вместо обратной косой черты для расположения файлов Windows в R.

MacOS

Чтобы открыть файл графика в системах MacOS, необходимо использовать системную функцию и указать команду и имя файла. Например:

теги должны быть в первой и последней строке -->

В MacOS для открытия файла используется команда "open", которая открывает указанный файл с помощью программы по умолчанию для этого типа файла.

Если вы хотите открыть файл в другой программе, вы можете указать это в команде. Например, чтобы открыть PDF-файл в Safari, используйте следующий код:

теги должны быть в первой и последней строке -->

Приведенный выше код предполагает, что файл, который вы хотите открыть, находится в текущем рабочем каталоге R. Если файл находится в другом месте, вам нужно указать R, где его найти.

Например, если вы хотите открыть CSV-файл с именем "data.csv", который находится на вашем рабочем столе, вы можете использовать следующий код:

теги должны быть в первой и последней строке -->

Линукс

Чтобы открыть файл графика в системах Linux, необходимо использовать системную функцию и указать команду и имя файла. Например:

теги должны быть в первой и последней строке -->

В большинстве дистрибутивов Linux универсальной командой для открытия файла является "xdg-open", которая открывает указанный файл с помощью программы по умолчанию для этого типа файла. Проверьте документацию по вашей системе, если эта команда не работает.

Если вы хотите открыть файл в другой программе, вы можете указать это в команде. Например, чтобы открыть PDF-файл в LibreOffice, используйте следующий код:

теги должны быть в первой и последней строке -->

Приведенный выше код предполагает, что файл, который вы хотите открыть, находится в текущем рабочем каталоге R. Если файл находится в другом месте, вам нужно указать R, где его найти.

Например, если вы хотите открыть CSV-файл с именем "data.csv", который находится в папке "Документы", вы можете использовать следующий код (изменив расположение файла для вашей системы):

теги должны быть в первой и последней строке -->

Просто, да? Открывать файлы в R стало намного проще!

Конечно, оболочка и системные функции могут использоваться для других системных команд, и вам следует проверить файлы справки для этих функций, если вы хотите узнать больше.

Спасибо за прочтение. Пожалуйста, оставьте свои отзывы или похвалы ниже.

Дополнительная литература

Краткое руководство по типам линий (lty) — краткое руководство по различным типам линий, доступным в R, и по их использованию. [R Графика]

Краткое руководство по layout() в R. Как создавать многопанельные графики и рисунки с помощью функции layout(). [R Графика]

Всеобъемлющее и простое руководство по импорту данных R, охватывающее все, от импорта простых текстовых файлов до более сложных файлов SPSS и SAS.

Загрузка данных в R может быть довольно утомительной. Кажется, что почти каждый тип файла, который вы хотите получить в R, требует своей собственной функции, и даже в этом случае вы можете потеряться в аргументах функций. Короче говоря, время от времени довольно легко что-то перепутать, независимо от того, являетесь ли вы новичком или опытным пользователем R.

Чтобы удовлетворить эти потребности, DataCamp решила опубликовать подробное, но простое руководство по быстрому импорту данных в R, начиная с простых текстовых файлов и заканчивая более сложными файлами SPSS и SAS. Продолжайте читать это руководство, чтобы узнать, как легко импортировать файлы в R!

(Попробуйте этот интерактивный курс: Импорт данных в R (часть 1), чтобы работать с файлами CSV и Excel в R.)

Содержание

Проверка ваших данных

Для начала вам нужны данные. Данные могут быть сохранены в файле на вашем компьютере в формате Excel, SPSS или в файле другого типа. Когда ваши данные сохраняются локально, вы можете вернуться к ним позже, чтобы отредактировать, добавить дополнительные данные или изменить их, сохранив формулы, которые вы могли использовать для расчета данных и т. д.

Однако данные также можно найти в Интернете или получить из других источников.

Где найти эти данные, это выходит за рамки этого руководства, поэтому пока достаточно упомянуть этот список наборов данных и интерактивное руководство DataCamp, в котором рассказывается, как импортировать наборы данных Quandl и управлять ими.

Прежде чем двигаться дальше и узнать, как загружать данные в R, может быть полезно просмотреть следующий контрольный список, который облегчит правильный импорт данных в R:

Подготовка рабочего пространства R

Обязательно зайдите в RStudio и посмотрите, что нужно сделать, прежде чем начать там свою работу. Возможно, у вас есть среда, заполненная данными и значениями, которые вы можете удалить с помощью следующей строки кода:

Функция rm() позволяет вам «удалять объекты из указанной среды». В этом случае вы указываете, что хотите рассмотреть список для этой функции, который является результатом функции ls(). Эта последняя функция возвращает вам вектор строк символов, который дает имена объектов в указанной среде. Поскольку эта функция не имеет аргумента, предполагается, что вы имеете в виду наборы данных и функции, определенные вами как пользователем.

Далее вам также может быть удобно узнать, где находится ваш рабочий каталог в данный момент:

И вы можете подумать об изменении пути, который вы получаете в результате этой функции, например, к папке, в которой вы сохранили свой набор данных:

Чтение CSV, TXT, HTML и других распространенных файлов в R

Вы заметите, что следующие основные функции R предназначены для загрузки электронных таблиц в R, а не файлов Excel или других типов. Если вас больше интересует последнее, прокрутите немного дальше, чтобы узнать о способах импорта других файлов в R.

Чтение файлов TXT с помощью read.table()

Если у вас есть файл .txt или текстовый файл с разделителями табуляцией, вы можете легко импортировать его с помощью базовой функции R read.table() . Другими словами, содержимое вашего файла будет выглядеть примерно так

и может быть импортирован следующим образом:

Обратите внимание, что в идеале вы должны просто передать имя файла и расширение, потому что вы установили в качестве рабочего каталога папку, в которой находится ваш набор данных. Вы видели в фрагменте кода выше, что первый аргумент не всегда является именем файла, но, возможно, также может быть веб-страницей, содержащей данные. Аргумент заголовка указывает, указали ли вы имена столбцов в файле данных.Наконец, вы увидите, что с помощью этой функции ваши данные из файла станут объектом data.frame.

Проверьте окончательный результат импорта в чанке DataCamp Light!

Полезно знать, что функция read.table() является наиболее важной и часто используемой функцией для импорта простых файлов данных в R. Она проста и гибка. Вот почему вам следует ознакомиться с нашим предыдущим руководством по чтению и импорту файлов Excel в R, в котором очень подробно объясняется, как оптимально использовать функцию read.table().

Для файлов, не разделенных символами табуляции, например .csv и других файлов с разделителями, фактически используются варианты этой базовой функции.

Эти варианты почти идентичны функции read.table() и отличаются от нее только в трех аспектах:

  • Символ разделителя;
  • Аргумент заголовка всегда имеет значение TRUE, что указывает на то, что первая строка считываемого файла содержит заголовок с именами переменных;
  • Аргумент заполнения также имеет значение TRUE, что означает, что если строки имеют разную длину, пустые поля будут добавлены неявно.

Чтение файлов CSV в R

Если вы разделяете значения с помощью ; , вы обычно работаете с файлом .csv. Его содержимое будет выглядеть примерно так:

Чтобы успешно загрузить этот файл в R, вы можете использовать функцию read.table(), в которой вы указываете символ-разделитель, или вы можете использовать функции read.csv() или read.csv2(). Первая функция используется, если разделителем является , , вторая, если ; используется для разделения значений в вашем файле данных.

Помните, что функции read.csv() и read.csv2() почти идентичны функции read.table(), с той лишь разницей, что их аргументы заголовка и заполнения по умолчанию установлены как ИСТИНА. .

Совет: если вы хотите узнать больше об аргументах, которые можно использовать в функциях read.table() , read.csv() или read.csv2(), вы всегда можете ознакомиться с нашим чтением и импортом файлов Excel. в R, в котором подробно объясняется, как использовать функции read.table() , read.csv() или read.csv2().

Обратите внимание, что если вы получаете предупреждающее сообщение, которое гласит: «Неполная последняя строка найдена с помощью readTableHeader», вы можете попытаться перейти и «встать» на ячейку, содержащую последнее значение (в данном случае c), и нажать клавишу ВВОД. Это обычно устраняет предупреждение, поскольку сообщение указывает, что последняя строка файла не заканчивается символом конца строки (EOL), который может быть переводом строки или возвратом каретки и переводом строки. Не забудьте сохранить файл, чтобы убедиться, что ваши изменения сохранены!

Совет: используйте текстовый редактор, например Блокнот, чтобы убедиться, что вы добавляете символ EOL без добавления новых строк или столбцов к вашим данным.

Также обратите внимание, что если вы инициализировали другие ячейки, кроме тех, которые содержат ваши данные, вы увидите, что некоторые строки или столбцы появятся со значениями NA. Лучше всего удалить эти строки и столбцы!

read.delim() для файлов с разделителями

Если у вас есть файл с разделителем, отличным от табуляции, запятой или точки с запятой, вы всегда можете использовать функции read.delim() и read.delim2(). Это варианты функции read.table(), такие же, как функция read.csv().

Следовательно, они имеют много общего с функцией read.table(), за исключением того факта, что они предполагают, что первая считываемая строка является заголовком с именами атрибутов, а табуляция используется в качестве разделитель вместо пробела, запятой или точки с запятой. У них также есть аргумент заполнения, установленный в TRUE , что означает, что пустое поле будет добавлено к строкам неравной длины.

Вы можете использовать функции read.delim() и read.delim2() следующим образом:

Пакет XLConnect для чтения файлов Excel

Чтобы загрузить файлы Excel в R, сначала необходимо выполнить дополнительную подготовку рабочего пространства в том смысле, что вам необходимо установить пакеты.

Для этого просто запустите следующий фрагмент кода:

Когда вы установили пакет, вы можете просто ввести следующее, чтобы активировать его в своей рабочей области:

Импорт файлов Excel с помощью пакета XLConnect

Первый способ загрузить файлы Excel непосредственно в R — использовать пакет XLConnect. Установите пакет и, если вы не уверены, есть ли он у вас уже, проверьте, есть ли он уже там.

Далее вы можете начать использовать функцию readWorksheetFromFile(), как показано ниже:

Обратите внимание, что вам нужно добавить аргумент листа, чтобы указать, какой лист вы хотите загрузить в R. Вы также можете добавить дополнительные спецификации. Вы можете найти их объяснение в нашем руководстве по чтению и импорту файлов Excel в R.

Вы также можете загрузить всю книгу с помощью функции loadWorkbook(), чтобы затем прочитать рабочие листы, которые вы хотите отобразить в виде фреймов данных в R, с помощью readWorksheet():

Еще раз обратите внимание, что аргумент листа — не единственный аргумент, который можно использовать в readWorkSheetFromFile() . Если вам нужна дополнительная информация о пакете или обо всех аргументах, которые вы можете передать функции readWorkSheetFromFile() или двум упомянутым альтернативным функциям, вы можете посетить страницу пакета RDocumentation.

Импорт файлов Excel с помощью пакета Readxl

Пакет readxl позволяет пользователям R легко читать файлы Excel, например:

Обратите внимание, что первый аргумент указывает путь к файлу .xls или .xlsx, который можно задать с помощью функций getwd() и setwd(). Вы также можете добавить аргумент листа, как в пакете XLConnect, и многие другие аргументы, о которых вы можете прочитать здесь или в этом сообщении блога.

Чтение файлов JSON в R

Чтобы загрузить файлы JSON в R, сначала необходимо установить или загрузить пакет rjson. Если вы хотите узнать, как установить пакеты или как проверить, установлены ли пакеты, прокрутите немного вверх до раздела импорта файлов Excel в R :)

После этого вы можете использовать функцию fromJSON(). Здесь у вас есть два варианта:

  1. Ваш файл JSON хранится в вашем рабочем каталоге:
    1. Ваш файл JSON доступен по URL-адресу:

    Чтение XML-данных в R

    Если вы хотите получить XML-данные в R, одним из самых простых способов является использование пакета XML. Во-первых, убедитесь, что вы установили и загрузили пакет XML в свою рабочую область, как показано выше. Затем вы можете использовать функцию xmlTreeParse() для анализа XML-файла непосредственно из Интернета:

    Далее вы можете проверить, знает ли R, что xmlfile находится в формате XML, введя:

    Совет: вы можете использовать функцию xmlRoot() для доступа к верхнему узлу:

    Вы заметите, что данные представлены как-то странно при печати вектора xmlfile. Это связано с тем, что на данный момент XML-файл все еще является настоящим XML-документом в R. Чтобы поместить данные во фрейм данных, сначала необходимо извлечь значения XML. Для этого вы можете использовать функцию xmlSApply():

    Первым аргументом этой функции будет topxml , так как это верхний узел, на дочернем узле которого вы хотите выполнить определенную функцию. Затем вы перечисляете функцию, которую хотите применить к каждому дочернему узлу. В этом случае вы хотите извлечь содержимое конечного XML-узла. В сочетании с первым аргументом topxml это гарантирует, что вы сделаете это для каждого конечного узла XML.

    Наконец-то вы помещаете значения во фрейм данных!

    Для этого используется функция data.frame() в сочетании с функцией перестановки матриц t(). Кроме того, вы также указываете, что имена строк не должны включаться:

    Если вы считаете, что предыдущие шаги слишком сложны, просто сделайте следующее:

    Импорт данных из таблиц HTML в R

    Из HTML-таблиц в R довольно просто:

    Обратите внимание, что аргумент which позволяет указать, какие таблицы возвращать из документа.

    Если это выдает ошибку типа «не удалось загрузить внешний объект», не смущайтесь: об этой ошибке сообщали многие люди, и автор пакета подтвердил ее здесь.

    Это можно обойти, используя пакет RCurl в сочетании с пакетом XML для чтения ваших данных:

    Обратите внимание, что вы не хотите, чтобы строки регистрировались как факторы или категориальные переменные! Вы также можете использовать пакет httr, чтобы сделать то же самое, за исключением того факта, что вы захотите преобразовать необработанные объекты содержимого URL-адреса в символы с помощью аргумента rawToChar:

    Чтение SAS, SPSS и других наборов данных в R

    Как вы уже знаете, R — это язык программирования и программная среда для статистических вычислений. Вот почему меня, вероятно, не удивит, когда я скажу, что многие люди используют R как альтернативу с открытым исходным кодом коммерческим статистическим программам, таким как SPSS, SAS и т. д.

    В этом разделе вы увидите, как можно импортировать данные из передовых статистических программ: вы увидите, какие пакеты необходимо установить для чтения ваших файлов данных в R, точно так же, как вы сделали это с данными, хранится в файлах Excel или JSON.

    Чтение файлов SPSS в R

    Если вы используете программное обеспечение SPSS и хотите импортировать файлы SPSS в R, сначала установите сторонний пакет. После загрузки пакета запустите содержащуюся в нем функцию read.spss(), и все готово!

    Подсказка: если вы хотите, чтобы результат отображался во фрейме данных, обязательно установите to.data.Аргумент кадра функции read.spss() равен TRUE. Кроме того, если вы НЕ хотите, чтобы переменные с метками значений преобразовывались в R-факторы с соответствующими уровнями, вы должны установить для аргумента use.value.labels значение FALSE:

    Помните, что факторы — это переменные, которые могут содержать только ограниченное количество различных значений. Поэтому их часто называют «категориальными переменными». Различные значения факторов могут быть помечены, поэтому их часто называют «метками значений».

    Чтение файлов статистики в R

    Чтобы импортировать файлы Stata, вы продолжаете использовать внешний пакет. Используйте функцию read.dta(), чтобы получить данные в R:

    Чтение файлов Systat в R

    Если вы хотите получить файлы Systat в R, вы также хотите использовать внешний пакет, как показано ниже:

    Чтение файлов SAS в R

    Для пользователей, которые также хотят импортировать файлы SAS в R, это очень просто! Для начала установите пакет sas7bdat. Загрузите его, а затем вызовите функцию read.sas7bdat(), содержащуюся в пакете, и все готово!

    Интересует ли вас эта функция и хотите ли вы узнать больше? Посетите страницу документации R.

    Обратите внимание, что вы также можете использовать внешнюю библиотеку для загрузки данных SAS в R. В таких случаях вы начнете с постоянного набора данных SAS или библиотеки формата SAS XPORT с read.ssd() и read.xport. () функций соответственно. Для получения дополнительной информации нажмите здесь.

    Чтение файлов Minitab в R

    Является ли выбранным вами программным обеспечением для статистических целей Minitab? Не смотрите дальше, если вы хотите использовать данные Minitab в R!

    Импортировать файлы .mtp в R довольно просто. Больше не будет сюрпризом, что вам нужно будет установить сторонний пакет и загрузить его. Затем просто используйте функцию read.mtp() из этого пакета:

    Чтение файлов RDA или RData в R

    Если ваш файл данных сохранен в R как файл .rdata, вы можете прочитать его следующим образом:

    Чтение баз данных и других источников в R

    Поскольку в этом руководстве основное внимание уделяется импорту данных из различных типов источников, уместно также кратко упомянуть, что вы можете импортировать в R данные, поступающие из баз данных, веб-скрейпинга и т. д.

    Чтение реляционных и нереляционных баз данных в R

    Импорт данных из реляционных баз данных

    Для получения дополнительной информации о переносе данных из реляционных баз данных в R ознакомьтесь с этим руководством по импорту данных из MonetDB.

    Однако, если вы хотите загрузить данные из MySQL в R, вы можете следовать этому руководству, в котором для импорта данных в R используется пакет dplyr.

    Если вам интересно узнать больше об этом последнем пакете, обязательно ознакомьтесь с интерактивным курсом DataCamp, который определенно необходим всем, кто хочет использовать dplyr для доступа к данным, хранящимся вне R в базе данных. Кроме того, курс также научит вас выполнять сложные задачи по обработке данных с помощью dplyr!

    Импорт данных из нереляционных баз данных

    Для получения дополнительной информации о загрузке данных из нереляционных баз данных в R, таких как данные из MongoDB, вы можете прочитать эту публикацию в блоге из «Еще одного блога по статистическим вычислениям» для обзора того, как загружать данные из MongoDB в R.< /p>

    Импорт данных с помощью веб-скрейпинга

    Вы можете прочитать о том, как очищать данные JavaScript с помощью R с использованием PhantomJS и пакета rvest, в этом руководстве по DataCamp. Если вы хотите использовать API для импорта данных, вы можете легко найти его здесь.

    Совет: вы можете ознакомиться с этим набором замечательных руководств, посвященных основам веб-скрейпинга.

    Импорт данных через пакет TM

    Для тех из вас, кто заинтересован в импорте текстовых данных, чтобы начать анализ текстов, вы можете прочитать текстовый файл следующим образом после установки и активации пакета tm:

    Затем вам нужно убедиться, что вы загружаете эти данные как совокупность, чтобы правильно начать работу:

    Вы можете найти доступное руководство по интеллектуальному анализу текста с помощью R здесь.

    Это только начало…

    Загрузка данных в R — это лишь небольшой шаг в увлекательном путешествии по анализу данных, обработке и визуализации. DataCamp поможет вам в этом!

    Продолжите наш курс «Импорт данных в R» или приступайте к созданию моделей на основе ваших данных: наше машинное обучение вам точно пригодится, как и наше «Введение в машинное обучение».

    Если вы хотите продолжить манипулирование данными, изучите учебник DataCamp «15 простых решений проблем с фреймами данных в R» или подумайте о том, чтобы пройти курс data.table от DataCamp.

    Не знаете, с чего начать? Ознакомьтесь с учебным планом курса DataCamp и узнайте, что вас ждет впереди на пути к науке о данных с DataCamp!

    3.1 Создайте файл сценария R в своей папке, затем запустите RStudio, дважды щелкнув этот файл

    Создать новый файл сценария R можно как минимум двумя способами:

    1. Откройте RStudio, чтобы получить пустую страницу исходного кода сценария; затем сохраните файл (используя меню «Файл»), дав ему имя с расширением .R и выбрав каталог на своем компьютере, где вы хотите его сохранить (например, папку для этого класса). После этого закройте RStudio. Затем перейдите в папку, в которой вы сохранили файл сценария R, и снова откройте его, дважды щелкнув файл. Возможно, вам потребуется щелкнуть файл правой кнопкой мыши и использовать команду «Открыть с помощью», чтобы ваш компьютер открыл файл R с помощью RStudio.
    • Оттуда вы также сможете настроить компьютер на постоянное использование RStudio для файлов с расширениями .R. Закрыв RStudio, а затем перейдя в свою папку, чтобы напрямую открыть файл R, наш сеанс R автоматически установит рабочий каталог в качестве местоположения этой папки. Другими словами, это ленивый способ (который я полностью ценю), потому что мы можем избежать необходимости вручную устанавливать рабочий каталог.
    1. Перейдите в каталог, в котором вы хотите сохранить файл, и создайте новый документ с расширением .R. 2 Вы можете назвать свой файл, например, MyAnalysis.R. 3 Откройте файл. Как упоминалось выше, вам может потребоваться использовать функцию «Открыть с помощью» и настроить компьютер так, чтобы файлы .R всегда открывались с помощью RStudio.

    Конечно, вы также можете поместить существующий файл сценария в папку и запустить новый сеанс RStudio, щелкнув этот файл. Например, если вы получили некоторые данные и файл сценария R (из онлайн-источника, своего инструктора или коллеги), вы можете поместить файлы в свою папку и открыть файл сценария оттуда. Это создаст рабочий каталог в нужном месте (пока RStudio еще не открыт).

    3.2 Если вам нужно установить рабочий каталог

    Обратите внимание, что при запуске сеанса RStudio из папки, в которой нет ваших данных, например, при доступе к ярлыку на рабочем столе, вам потребуется создать рабочий каталог, введя что-то вроде этого в свой сценарий: setwd ("C:/Пользователи/Ваше имя/Рабочий стол/Ваша папка"). 4

    В качестве альтернативы использованию функции setwd() можно использовать графический интерфейс RStudio. Итак, если у вас есть данные и сценарий R в папке, но вы не можете прочитать данные (возможно, потому, что вы открыли RStudio из меню приложений вместо того, чтобы щелкнуть файл в папке), вы можете сделать это: Перейдите на панель, которая показывает ваши файлы, графики, пакеты и т. д. Откройте вкладку файлов и перейдите к папке, в которой находятся ваши данные, нажав кнопку с многоточием . справа. После этого перейдите в меню «Дополнительно» и выберите «Установить как рабочий каталог».

    Теперь на вкладке с файлами отображается нужная нам папка (в данном примере это папка на рабочем столе).

    Вот каталог "Дополнительно", где можно выбрать "Установить как рабочий каталог".

    Вместо того, чтобы возиться со всей этой работой с рабочими каталогами, проще поместить все наши файлы в одну папку и запустить сеанс RStudio, щелкнув файл .R. 5

    На ПК вы можете щелкнуть правой кнопкой мыши папку и создать новый файл, а затем изменить расширение с .txt на .R .↩︎

    Возможно, вам потребуется указать компьютеру отображать расширения файлов, например .docx для документов Word и .R для файлов сценариев R.↩︎

    Путь к каталогу зависит от вашей операционной системы, настройки ваших папок и, конечно же, от того, где вы хотите сохранить файл. Если вы хотите увидеть, где находится ваш рабочий каталог, используйте функцию getwd().↩︎

    Часто перед выполнением домашнего задания необходимо импортировать образцы данных из учебника в R.

    Файл Excel

    Довольно часто образцы данных представлены в формате Excel, и перед использованием их необходимо импортировать в R. Для этого мы можем использовать функцию read.xls из пакета gdata. Он читает из электронной таблицы Excel и возвращает фрейм данных. Ниже показано, как загрузить электронную таблицу Excel с именем «mydata.xls». Этот метод требует наличия в системе среды выполнения Perl.

    В качестве альтернативы мы можем использовать функцию loadWorkbook из пакета XLConnect, чтобы прочитать всю книгу, а затем загрузить рабочие листы с помощью readWorksheet. Пакет XLConnect требует предварительной установки Java.

    Файл Minitab

    Если файл данных имеет формат Minitab Portable Worksheet, его можно открыть с помощью функции read.mtp из стороннего пакета. Он возвращает список компонентов на рабочем листе Minitab.

    Файл SPSS

    Для файлов данных в формате SPSS его можно открыть с помощью функции read.spss также из стороннего пакета. Существует опция «to.data.frame» для выбора, должен ли быть возвращен фрейм данных. По умолчанию вместо этого возвращается список компонентов.

    Табличный файл

    Таблица данных может находиться в текстовом файле. Ячейки внутри таблицы разделяются пробелами. Вот пример таблицы с 4 строками и 3 столбцами.

    Теперь скопируйте и вставьте приведенную выше таблицу в файл с именем «mydata.txt» с помощью текстового редактора. Затем загрузите данные в рабочую область с помощью функции read.table .

    Дополнительные сведения о функции read.table см. в документации по R.

    CSV-файл

    Данные образца также могут быть представлены в формате значений, разделенных запятыми (CSV). Каждая ячейка внутри такого файла данных отделяется специальным символом, которым обычно является запятая, хотя могут использоваться и другие символы.

    Первая строка файла данных должна содержать имена столбцов, а не фактические данные. Вот пример ожидаемого формата.

    После того, как мы скопируем и вставим приведенные выше данные в файл с именем "mydata.csv" с помощью текстового редактора, мы сможем прочитать данные с помощью функции read.csv .

    В различных европейских локалях, поскольку запятая служит десятичной точкой, вместо нее следует использовать функцию read.csv2. Дополнительные сведения о функциях read.csv и read.csv2 см. в документации по R.

    Рабочий каталог

    Наконец, в приведенных выше примерах кода предполагается, что файлы данных расположены в рабочем каталоге R, который можно найти с помощью функции getwd.

    Вы можете выбрать другой рабочий каталог с помощью функции setwd() и, таким образом, избежать ввода полного пути к файлам данных.

    Обратите внимание, что косая черта должна использоваться в качестве разделителя пути даже на платформе Windows.

    Читайте также: