R (язык программирования)
(→Как экспортировать данные из R ?) |
(→Как загружать (импортировать данные в R)) |
||
Строка 42: | Строка 42: | ||
== Как загружать (импортировать данные в R) == | == Как загружать (импортировать данные в R) == | ||
− | + | ; data <- read.table(file.choose(),header=TRUE, sep=";", encoding="UTF-8") | |
− | + | : | |
− | + | ; x <- read.csv(file.choose(),header=TRUE, sep=";", encoding="UTF-8") | |
+ | : | ||
== Как экспортировать данные из R ? == | == Как экспортировать данные из R ? == |
Версия 22:24, 31 января 2016
R — язык программирования для статистической обработки данных и работы с графикой. Используется в Летописи для внешнего анализа данных наряду с Netlogo и Графвиз.
Содержание[убрать] |
Базовые возможности
Типы данных
Векторы
Векторы (vector) – это одномерные массивы данных, которые могут содержать числовые, текстовые или логические значения. Для создания вектора применяется функция объединения c(). Вот примеры векторов каждого типа:
a <- c(1, 2, 5, 3, 6, -2, 4) b <- c(“one”, “two”, “three”)
c <- c(TRUE, TRUE, TRUE, FALSE,
Матрицы
Матрица (matrix) – это двумерный массив данных, в котором каждый элемент имеет одинаковый тип (числовой, текстовый или логический). Вы можете обозначать строки, столбцы и элементы матрицы при помощи индексов и квадратных скобок. Например, X[i,] обозначает i-ую строку матрицы X, X[,j] – обозначает ее j-ый столбец, а X[i, j] соответствует элементу этой матрицы, расположенному на пересечении этой строки и этого столбца.
Массивы
Массивы данных (array) сходны с матрицами, но могут иметь больше двух измерений.
Таблицы
Таблица данных (data frame) – это более широко используемый по сравнению с матрицей объект, поскольку разные столбцы могут содержать разные типы данных (числовой, текстовый и т. д.). Таблица данных – это самая часто используемая структура данных в R.
Факторы
Категориальные (номинальные и порядковые) данные называются в R факторами.
Например, есть вектор diabetes <- c(“Type1”, “Type2”, “Type1”, “Type1”).
Команда diabetes <- factor(diabetes) преобразует этот вектор в (1, 2, 1, 1) и устанавливает внутреннее соответствие 1=Type1 и 2=Type2 (присвоение числовых значений происходит в алфавитном порядке).
Установку по умолчанию можно изменить при помощи параметра levels. Например, status <- factor(status, order=TRUE, levels=c(“Poor”, “Improved”, “Excellent”))
Списки
Списки – это самый сложный тип данных в R. Фактически список – это упорядоченный набор объектов (компонентов).
Как загружать (импортировать данные в R)
- data <- read.table(file.choose(),header=TRUE, sep=";", encoding="UTF-8")
- x <- read.csv(file.choose(),header=TRUE, sep=";", encoding="UTF-8")
Как экспортировать данные из R ?
data <- read.table(file.choose(),header=TRUE, sep=";", encoding="UTF-8")
x <- read.csv(file.choose(),header=TRUE, sep=";", encoding="UTF-8")
Диаграммы
dev.new() plot()
Специальные пакеты
Процедура представления совместной деятельности как графа
В данном случае - исходные данные = действия участников блога Галактика в 2010 году - как все это начиналось и во что это сложилось. См. История образовательной Галактики
- vertex.color цвет вершины
- vertex.frame.color цвет контура вершины
- vertex.shape форма обозначения вершины, одно из значений «none», «circle», «square», «csquare», «rectangle», «crectangle», «vrectangle», «pie», «raster», «sphere»
- vertex.size размер вершины (по умолчанию 15)
- vertex.size2 второй параметр размера вершины (например, для прямоугольника)
- vertex.label вектор символов для обозначения вершин
- vertex.label.family семейство шрифтов для меток вершин (например, «Times», «Helvetica»)
- vertex.label.font шрифт: 1 — обычный, 2 — жирный, 3 — курсив, 4 — жирный курсив, 5 — символьный
- vertex.label.cex размер шрифта (множитель, зависит от устройства)
- vertex.label.dist расстояние между меткой и вершиной
Пакет для обработки решеток Келли - OpenRepGrid
- http://kateto.net/network-visualization
- Визуализация статических и динамических сетей на R - http://habrahabr.ru/company/infopulse/blog/263953/