4
голосов
2ответов
2533 просмотров

Как эффективно найти корреляцию и отбросить точки за пределами диапазона 3 сигм в MATLAB?

У меня есть файл данных m.txt, который выглядит примерно так (с гораздо большим количеством точек): 286.842995 3.444398 3.707202 338.227797 3.597597 283.740414 3.514729 3.512116 3.744235 3.365461 3.384880 Некоторые значения (например, 338.227797) сильно отличаются от тех значений, кот...

2
голосов
4ответов
238 просмотров

Статистический вопрос

Предположим, я провожу опрос 10 человек, которые спрашивают, стоит ли дать фильму оценку от 0 до 4 звезд.Возможные ответы: 0, 1, 2, 3 и 4. Среднее значение - 2,0 звезды Как рассчитать достоверность (или неопределенность) этого рейтинга в 2,0 звезды?В идеале мне нужно число от 0 до 1, где 0...

2
голосов
7ответов
7202 просмотров

Вычисление дисперсии с большими числами

На самом деле я не особо использовал расчет дисперсии и не знаю, чего ожидать.На самом деле я совсем не разбираюсь в математике. У меня есть массив из 1000000 случайных числовых значений в диапазоне 0–10000. Массив может вырасти еще больше, поэтому для суммы я использую 64-битное int. Я...

1
голосов
2ответов
255 просмотров

Статистический пакет R: упаковка объектов GOFrame

Я пытаюсь создать объекты GOFrame, чтобы создать отображение онтологии генов в R для неподдерживаемых организмов (см. http://www.bioconductor.org/packages/release/bioc/vignettes/GOstats/inst/doc/GOstatsForUnsupportedOrganisms.pdf ). Однако следование инструкциям мне не помогает. Вот код, кот...

10
голосов
3ответов
20945 просмотров

Как собрать серию значений с плавающей запятой в гистограмму в Python?

У меня есть значение с плавающей запятой (всегда меньше 0).Который я хочу объединить в гистограмму, я, д.каждая полоса гистограммы содержит диапазон значений [0,0.150) Данные, которые у меня есть, выглядят так: 0.000 0.005 0.124 0.000 0.004 0.000 0.111 0.112 С моим кодом ниже я ожидаю ...

9
голосов
6ответов
3217 просмотров

Генерация коррелированных чисел

Вот забавный вопрос: мне нужно сгенерировать случайные пары x / y, которые коррелируют с заданным значением коэффициент корреляции момента произведения Пирсона или r Пирсона .Вы можете представить это как два массива, массив X и массив Y, где значения массива X и массива Y должны быть повторно ...

0
голосов
8ответов
717 просмотров

Можно ли подобрать алгебраическую кривую всего за один проход данных выборки?

Я хотел бы провести алгебраическую кривую точек данных, но по разным причинам - на самом деле невозможно иметь большую часть выборочных данных в памяти одновременно, а их итерация - дорогостоящий процесс. (Причина в том, что на самом деле мне нужно одновременно подогнать тысячи кривых на о...

46
голосов
3ответов
62049 просмотров

Моделирование многомерных временных рядов в R

Я хочу соответствовать какой-то модели многомерных временных рядов с использованием R. Вот образец моих данных: u cci bci cpi gdp dum1 dum2 dum3 dx 16.50 14.00 53.00 45.70 80.63 0 0 1 6.39 17.45 16.00 64.00 46.30 80.90 0 0 0 ...

4
голосов
2ответов
2920 просмотров

Есть ли бесплатный пакет статистики для Delphi?

Есть ли пакет или библиотека для статистики с открытым исходным кодом и / или бесплатно для Delphi ? Я ищу что-то, что можно компилировать прямо в исполняемый файл, поэтому никаких DLL. Он должен быть совместим с Delphi 2009 и новее (версии Unicode). Надеюсь, что есть что-то всеобъемлющее. Д...

17
голосов
3ответов
33369 просмотров

Средневзвешенное значение в T-SQL (например, SUMPRODUCT в Excel)

Я ищу способ получить средневзвешенное значение из двух строк данных с одинаковым количеством столбцов, где среднее значение выглядит следующим образом (заимствование нотации Excel): (A1*B1)+(A2*B2)+...+(An*Bn)/SUM(A1:An) Первая часть отражает те же функции, что и функция СУММПРОИЗВ () в ...

0
голосов
2ответов
2666 просмотров

Как отобразить 10 лучших участников в Confluence

Я хотел бы отобразить 10 самых активных участников пространства в Confluence за последний год, которые создавали, обновляли или удаляли страницы. Есть статистика по Browse Space > Activity, но только за месяц, а не за год.

4
голосов
5ответов
1638 просмотров

Как мне эффективно оценить вероятность на основе небольшого количества доказательств?

Я несколько месяцев пытался найти ответ на этот вопрос (для использования в приложении для машинного обучения), не похоже, что это должно быть ужасно сложной проблемой, но я инженер-программист и математика никогда не была моей сильной стороной. Вот сценарий: У меня есть (возможно) неравно...

5
голосов
4ответов
2109 просмотров

Инструмент для статистики программы

Есть ли инструмент, который может анализировать мой исходный код (fortran, C или C ++) и возвращать статистику, такую как количество циклов, средний размер цикла, количество функций, количество вызовов функций, количество, размер и тип массивов, переменных и т. д.? Что-то похожее на this , к...

0
голосов
1ответов
1218 просмотров

Objective-C реализация интервала оценок Вильсона

Я ищу библиотеку objective-c или просто функции, которые могут обрабатывать вычисление интервала оценки Уилсона, объясненного здесь: http://www.evanmiller.org/how-not-to-sort-by-average-rating.html Для справки, вот реализация Ruby из того же источника: require 'statistics2' def ci_lo...

17
голосов
7ответов
22621 просмотров

Создание гауссовского распределения только с положительными числами

Есть ли способ случайным образом сгенерировать набор положительных чисел, чтобы они имели желаемое среднее значение и стандартное отклонение? У меня есть алгоритм генерации чисел с гауссовым распределением, но я не знаю, как поступать с отрицательными числами таким образом, чтобы при этом сох...

1
голосов
4ответов
899 просмотров

Аналитика Отслеживание динамической страницы

Я использую Google Analytics и хочу различать два разных случая на главной странице,в частности, в зависимости от того, вошел ли пользователь или вышел из системы (аналогично facebook). Было предложено использовать разные URL-адреса для каждой страницы, но я не хочу, чтобы это связано с изм...

4
голосов
7ответов
5735 просмотров

Эффективно находить ранги элементов в массиве?

Как эффективно определить ранг каждого элемента массива, усредняя в случае связей?Например: float[] rank(T)(T[] input) { // Implementation } auto foo = rank([3,6,4,2,2]); // foo == [3, 5, 4, 1.5, 1.5] Единственный способ, которым я могу это сделать, - это выделить 3 массива: Дуб...

1
голосов
2ответов
755 просмотров

Устойчивое состояние в моделировании, ориентированном на процесс

В настоящее время я пишу симулятор, ориентированный на процессы, с использованием JavaSim для сдачи университетского экзамена.Сам симулятор работает нормально, но у меня есть одно серьезное сомнение: есть ли правильный / лучший способ найти устойчивое состояние симуляции в коде? В книге, ...

2
голосов
1ответов
2786 просмотров

Суммирование по категориальной переменной

У меня есть набор данных о продажах комиксов по объему (например, Naruto v10), который мне нужно сократить до продаж по сериям (чтобы все объемные продажи Naruto были объединены в одно наблюдение).У меня есть переменная «серия», которая определяет серию каждого наблюдения.Эквивалентный код в Sta...

15
голосов
4ответов
73735 просмотров

Перебирать строковые переменные в R

При программировании в Stata я часто использую индекс цикла при программировании.Например, я перебираю список переменных nominalprice и realprice: local list = "nominalprice realprice" foreach i of local list { summarize `i' twoway (scatter `i' time) graph export "C:\TimePlot-`i'.png" }...

20
голосов
5ответов
25972 просмотров

Функция z-значения стандартного нормального распределения в C #

Я просматривал недавнее сообщение в блоге Джеффа Этвуда о Альтернативных порядках сортировки . Я попытался преобразовать код в сообщении на C #, но столкнулся с проблемой. Я знаю, что в .NET нет функции, которая возвращала бы z-значение с учетом процента площади под стандартной нормальной криво...

5
голосов
7ответов
219 просмотров

алгоритмы оценки ответов пользователей

Я работаю над веб-приложением, которое будет использоваться для классификации фотографий автомобилей. Пользователям будут представлены фотографии различных транспортных средств, и им будет предложено ответить на ряд вопросов о том, что они видят. Результаты будут записаны в базу данных, усреднен...

2
голосов
1ответов
810 просмотров

Как использовать коррелограмму для оценки дисперсии?

Из книги по компьютерному моделированию я получил эти два уравнения. Первый - вычислить коррелограмму , второй - как использовать коррелограмму для оценки дисперсии. . Общий подход к оценке дисперсии наблюдений часто не является неправильным в компьютерном моделировании, поскольку ...

2
голосов
3ответов
2709 просмотров

Найдите только релевантные точки в MATLAB

У меня есть функция MATLAB, которая находит характерные точки в образце. К сожалению, это работает только в 90% случаев. Но когда я знаю, какие места в образце мне следует искать, я могу увеличить это значение почти до 100%. Поэтому я хотел бы знать, есть ли в MATLAB функция, которая позволила б...

1
голосов
2ответов
2194 просмотров

SAS и веб-данные

Я посещал несколько курсов для аспирантов с профессором, который мне очень нравится, и она все время в восторге от SAS. Я «вырос», изучая статистику с помощью SPSS, и с их недавними решениями интегрировать свой статистический движок с R и Python, мне трудно пробудить желание изучать что-то еще. ...

24
голосов
9ответов
26588 просмотров

C # нормальное случайное число

Я хотел бы создать функцию, которая принимает Double mean, Double deviation и возвращает случайное число с нормальным распределением. Пример: если я выберу 5,00 как среднее значение и 2,00 как отклонение, в 68% случаев я получу число от 3,00 до 7,00 Моя статистика немного слабая….У кого-ниб...

8
голосов
3ответов
34553 просмотров

Переход по столбцу в R

Я использую пакет R's stats и хочу перебрать column[x] в all the rows of a dataframe, оперировать данными в each cell в столбце с функцией и передать результат в новый столбец (с calculated result в new column, выровненным с даннымив column[x] г.) У меня две проблемы: Я не могу заставить ...

0
голосов
3ответов
128 просмотров

Представляете приложению пакет статистики Java?

В настоящее время у меня есть веб-приложение, и я хочу добавить на сайт определенную статистику.Эта статистика будет в дополнение к веб-статистике. Я могу легко записывать определенные события в файл через log4j.Могу ли я добавить что-нибудь, что позволит исследовать данные и отформатироват...

8
голосов
5ответов
667 просмотров

Алгоритмы поиска того, что пользователь хотел бы, на основе того, что нравится другим пользователям

Я подумываю написать приложение для классификации фильмов на HTPC на основе того, что нравится членам семьи. Я не знаю статистики или искусственного интеллекта, но материал, который здесь , выглядит очень сочным. Не знаю, с чего начать. Вот чего я хочу добиться: Составьте набор образ...

0
голосов
2ответов
147 просмотров

путь нажатия пользователя

Я пытаюсь запрограммировать некоторые функции мониторинга поведения пользователей, и это немного сложно. Например, как вы записываете путь перехода пользователя для использования в будущем анализе? Я пытаюсь изобрести велосипед? это легко? это сложнее, чем я думаю?