511
голосов
11ответов
212957 просмотров

Быстрое чтение очень больших таблиц как фреймов данных

У меня очень большие таблицы (30 миллионов строк), которые я хотел бы загрузить как фреймы данных в R. read.table() имеет много удобных функций, но похоже, что в реализации есть много логики, которая замедлит работувниз.В моем случае я предполагаю, что заранее знаю типы столбцов, таблица не соде...

9
голосов
2ответов
4010 просмотров

Проблемы с R и HDF5

Я пытаюсь загрузить hdf5 в R и сталкиваюсь с некоторыми проблемами. Вот шаги, которые я предпринял для настройки своей среды: R 2.10.0 (x64) в Mac OS X 10.6 hdf5 1.8.3 устанавливается через macports hdf5_1.6.9.tar.gz из CRAN Я подозреваю, что моя проблема связана с несовместимостью м...

16
голосов
1ответов
5571 просмотров

Использование библиотек C ++ в пакете R

Как лучше всего использовать библиотеку C ++ в R с сохранением структур данных C ++. Я вовсе не пользователь C ++, поэтому мне не совсем ясны относительные достоинства доступных подходов. В руководстве R-ext, кажется, предлагается обернуть каждую функцию C ++ в C. Однако существует по крайней ме...

1
голосов
2ответов
255 просмотров

Статистический пакет R: упаковка объектов GOFrame

Я пытаюсь создать объекты GOFrame, чтобы создать отображение онтологии генов в R для неподдерживаемых организмов (см. http://www.bioconductor.org/packages/release/bioc/vignettes/GOstats/inst/doc/GOstatsForUnsupportedOrganisms.pdf ). Однако следование инструкциям мне не помогает. Вот код, кот...

11
голосов
4ответов
12863 просмотров

Изменение порядка уклоняемых баров в ggplot2 barplot

У меня есть фрейм данных df.all, и я рисую его в виде гистограммы с помощью ggplot2, используя приведенный ниже код.Я бы хотел сделать так, чтобы порядок уклоняемых полос был обратным.Таким образом, столбцы с меткой «Единственное число» располагаются перед столбцами с меткой «Множественное число...

7
голосов
3ответов
2650 просмотров

external () эквивалент для не векторных списков в R

Я понимаю, как external () работает в R: > outer(c(1,2,4),c(8,16,32), "*") [,1] [,2] [,3] [1,] 8 16 32 [2,] 16 32 64 [3,] 32 64 128 Обычно он берет 2 вектора, находит перекрестное произведение этих векторов, а затем применяет функцию к каждой паре в перекрестном...

1
голосов
2ответов
2479 просмотров

ggplot2: использование функции geom_area ()

У меня есть фрейм данных, показывающий четыре класса за каждый год, а также их соответствующие доли от общего количества за этот год. > head(df) class year share 1 class1 1975 0.806 2 class2 1975 0.131 3 class3 1975 0.018 4 class4 1975 0.045 5 class1 1976 0.788 6 cla...

25
голосов
10ответов
12385 просмотров

Функция секундомера в R

Есть ли функция таймера R или секундомера, аналогичная тику MATLAB?/ toc ?

2
голосов
1ответов
3177 просмотров

Как экспортировать данные из пакета ROCR

Я пытаюсь экспортировать биометрические данные из анализа с помощью пакета ROCR.Вот код, который я написал до сих пор: pred = performance(Matching.Score,Distribution) perf = prediction(pred,"fnr", "fpr") An object of class “performance” Slot "x.name": [1] "False positive rate" Slot "y.nam...

46
голосов
3ответов
62049 просмотров

Моделирование многомерных временных рядов в R

Я хочу соответствовать какой-то модели многомерных временных рядов с использованием R. Вот образец моих данных: u cci bci cpi gdp dum1 dum2 dum3 dx 16.50 14.00 53.00 45.70 80.63 0 0 1 6.39 17.45 16.00 64.00 46.30 80.90 0 0 0 ...

0
голосов
3ответов
779 просмотров

Странная ошибка при использовании разреженных матриц и glmnet

Я получаю странную ошибку при обучении регрессии в glmnet. invalid class "dgCMatrix" object: length(Dimnames[[2]])' must match Dim[2] Это случается только изредка и, возможно, только в больших наборах данных. Я не уверен, что это соответствует определенному набору данных. Есть подс...

28
голосов
2ответов
20353 просмотров

Как запустить R на сервере без X11 и избежать сломанных зависимостей

Я использую R 2.9 на большом экземпляре EC2 Ubuntu, загруженном с ОЗУ, но без терминала.Когда я загружаю библиотеку, которая имеет зависимости отображения, например пакет sqldf, я получаю следующую ошибку: library(sqldf) ... Loading required package: tcltk Loading Tcl/Tk interface ... Error i...

15
голосов
1ответов
2902 просмотров

Генерация неповторяющихся пар комбинаций в R

Извините за не описательный заголовок, но я не знаю, есть ли слово для обозначения того, чего я пытаюсь достичь. Предположим, у меня есть список имен разных классов, например c( '1', '2', '3', '4') Я хотел бы сгенерировать все возможные пары перестановок из этого, чтобы не было обратны...

21
голосов
12ответов
1815 просмотров

Какого полезного пакета R в настоящее время не существует?

Я работал над несколькими пакетами R для некоторых общих инструментов, которые в настоящее время недоступны в R: ведение блога, доставка отчетов, ведение журнала и планирование.Это заставило меня задуматься: какие самые важные вещи, которые люди хотят , существовали в R, но в настоящее время не...

15
голосов
2ответов
2588 просмотров

Отладка общих функций в R

Как отлаживать универсальную функцию (используя debug или mtrace в пакете отладки)? В качестве примера я хочу отладить cenreg в пакете NADA, в частности метод, который принимает ввод формулы. Вы можете получить подробную информацию о методе следующим образом: library(NADA) getMethod("ce...

4
голосов
2ответов
2920 просмотров

Есть ли бесплатный пакет статистики для Delphi?

Есть ли пакет или библиотека для статистики с открытым исходным кодом и / или бесплатно для Delphi ? Я ищу что-то, что можно компилировать прямо в исполняемый файл, поэтому никаких DLL. Он должен быть совместим с Delphi 2009 и новее (версии Unicode). Надеюсь, что есть что-то всеобъемлющее. Д...

174
голосов
9ответов
340777 просмотров

Для каждой строки в кадре данных R

У меня есть фрейм данных, и для каждой строки в нем мне нужно выполнить несколько сложных поисков и добавить некоторые данные в файл. DataFrame содержит научные результаты для выбранных лунок из 96-луночных планшетов, используемых в биологических исследованиях, поэтому я хочу сделать что-то в...

7
голосов
3ответов
2778 просмотров

Применение функции к матрице расстояний в R

Этот вопрос пришел сегодня в список рассылки манипулятора. http://groups.google.com/group/manipulatr/browse_thread/thread/fbab76945f7cba3f Я перефразирую. Для данной матрицы расстояний (рассчитанной с помощью dist) примените функцию к строкам матрицы расстояний. Код: library(plyr...

0
голосов
1ответов
546 просмотров

Сглаживание каждой панели в ggplot2

Я рисую группу кривых, используя фасет в ggplot2.Я бы хотел, чтобы сглаживание применялось к графикам, где достаточно точек для сглаживания, но не к графикам с очень небольшим количеством точек.В частности, я хотел бы предотвратить сбой графика, когда одна из панелей имеет только 1 или 2 точки. ...

155
голосов
9ответов
297415 просмотров

Фильтрация строк data.frame по логическому условию

Я хочу отфильтровать строки из data.frame на основе логического условия.Предположим, у меня есть фрейм данных вроде expr_value cell_type 1 5.345618 bj fibroblast 2 5.195871 bj fibroblast 3 5.247274 bj fibroblast 4 5.929771 hesc 5 5.873096 hesc 6 5.66...

13
голосов
3ответов
6558 просмотров

Как заставить пакет R работать как в Windows, так и в Linux

Я написал очень простой пакет на R. На самом деле я следовал это руководство по созданию базового пакета. Мой пакет отлично работает в Linux. например: > install.packages ("linmod", repos = NULL) Предупреждение в install.packages ("linmod", repos = NULL): аргумент 'lib' отсутствует:...

2
голосов
3ответов
460 просмотров

R встраиваемый

Я подумываю начать изучение R , но хочу знать одну вещь: можно ли встраивать его (Windows CE, Palm OS)?

14
голосов
6ответов
10282 просмотров

R - интерпретируемый или компилируемый язык программирования?

Является ли R интерпретируемым или компилируемым языком программирования?

40
голосов
9ответов
55052 просмотров

Разделить вектор строки на пробел

У меня есть следующий вектор: tmp3 <- c("1500 2", "1500 1", "1510 2", "1510 1", "1520 2", "1520 1", "1530 2", "1530 1", "1540 2", "1540 1") Я хотел бы просто сохранить второе число в каждом из атомов этого вектора, чтобы оно читалось: c(2,1,2,1,2,1,2,1,2,1)

1
голосов
1ответов
1623 просмотров

Как получить центральности собственных значений вершин в R с помощью igraph

У меня есть сеть, загруженная в объект igraph G, который имеет 198 вершин и 214 ребер.Если я бегу: eig<-evcent(G)$vector В результате получится eig вектор с 2172 элементами, а не 198 элементами. В документации на пакет утверждается, что он возвращает "центральные позиции v."Есть идеи,...

0
голосов
2ответов
254 просмотров

Отсутствует выходная матрица начальной загрузки

Когда я пытаюсь вычислить Gest в spatstat, я получаю сообщение об ошибке: Отсутствует выходная матрица начальной загрузки. Кто-нибудь знает, что я делаю не так?

3
голосов
1ответов
3954 просмотров

ARIMA, ARMA и AIC?

data <-c(88, 84, 85, 85, 84, 85, 83, 85, 88, 89, 91, 99, 104, 112, 126, 138, 146,151, 150, 148, 147, 149, 143, 132, 131, 139, 147, 150, 148, 145, 140, 134, 131, 131, 129, 126, 126, 132, 137, 140, 142, 150, 159, 167, 170, 171, 172, 172, 174, 175, 172, 172, 174, 174, 169, 165, 156, 142, 131, ...

2
голосов
1ответов
2786 просмотров

Суммирование по категориальной переменной

У меня есть набор данных о продажах комиксов по объему (например, Naruto v10), который мне нужно сократить до продаж по сериям (чтобы все объемные продажи Naruto были объединены в одно наблюдение).У меня есть переменная «серия», которая определяет серию каждого наблюдения.Эквивалентный код в Sta...

15
голосов
4ответов
73735 просмотров

Перебирать строковые переменные в R

При программировании в Stata я часто использую индекс цикла при программировании.Например, я перебираю список переменных nominalprice и realprice: local list = "nominalprice realprice" foreach i of local list { summarize `i' twoway (scatter `i' time) graph export "C:\TimePlot-`i'.png" }...

11
голосов
2ответов
8410 просмотров

matplotlib для пользователя R?

Я регулярно делаю рисунки (тип исследовательского анализа данных) на R. Я также программирую на Python, и мне было интересно, есть ли в matplotlib функции или концепции, которые стоит изучить.Например, я вполне доволен R, но его функция image () будет создавать большие файлы с пиксельным выводом...