Дослідна експлуатація

Наукові дослідження та статистичні методи обробки даних

Одночасно із стрімким розвитком науки, продукуванням великих масивів даних, інтеграцією окремих галузей сформувався новий соціальний запит на необхідність комплексних досліджень та впровадження математико-статистичних методів досліджень.

Особливість статистичних методів полягає в їх комплексності, що зумовлено як різноманітністю форм статистичних закономірностей, так і складністю самого процесу статистичного дослідження. Специфіка методів пояснюється змістом виконуваної роботи у процесі дослідження тих чи інших соціально-економічних явищ. Природа останніх досить складна і непередбачена, тому вивчати їх треба у взаємозв'язку і взаємозумовленості. Для цього статистична теорія розробила досить широке коло методологічних і методичних засобів, за якими можна кількісно вимірювати досліджувані зв'язки.

STATISTICA — це універсальний пакет статистичного аналізу, в якому реалізовані основні математичні методи аналізу даних. Пакет має широкий спектр функціональних алгоритмів і розвинену графіку, а також відповідні засоби для редагування графічних матеріалів. Містить більше 250 статистичних функцій, які об'єднані спеціалізованими статистичними модулями: основні статистики і таблиці, непараметрична статистика, дисперсійний аналіз, множинна регресія, нелінійне оцінювання, аналіз часових рядів і прогнозування, кластерний аналіз, факторний аналіз, функціональний аналіз, дискримінанта, аналіз тривалості життя, канонічна кореляція, багатовимірні шкали, моделювання структурними рівняннями тощо.

NVivo — це пакет програм для якісного аналізу даних (QDA), розроблений QSR International. NVivo допомагає дослідникам якісно упорядковувати, аналізувати та знаходити взаємозв'язки неструктурованих або нечислових даних, таких як інтерв'ю, відповіді на відкриті опитування, статті в журналах, соціальні мережі та вебконтент, де потрібний глибокий рівень аналізу малих або великих обсягів даних.

NVivo використовується переважно академічними, державними, медичними дослідниками в різних галузях, включаючи соціальні науки, такі як антропологія, психологія, соціальні комунікації, соціологія, а також такі галузі, як судова експертиза, туризм, кримінологія та маркетинг. Програмне забезпечення дозволяє користувачам класифікувати, сортувати та впорядковувати інформацію; досліджувати зв'язки в даних; поєднувати аналіз із моделюванням.

R — мова програмування і програмне середовище для статистичних обчислень, аналізу та зображення даних в графічному вигляді. Розробка R відбувалась під істотним впливом двох наявних мов програмування: мови програмування S з семантикою успадкованою від Scheme. R названа за першою літерою імені її засновників Роса Іхаки (Ross Ihaka) та Роберта Джентлмена (Robert Gentleman) працівників Оклендського Університету в Новій Зеландії.

SYSTAT — програма для статистичної обробки, що розроблена Systat Software, Inc, покликаний для представлення аналітичної інформації у вигляді графіків. Зокрема він містить такі функції, як ділова графіка; параметричні тести (критерії Стьюдента, Фішера, гістограма); непараметричні тести (хі-квадрат, знаків, серій, Вілкоксона, Колмогорова-Смірнова, кореляція Спірмана); категоріальний аналіз (кростабуляція, хі-квадрат оцінка, коефіцієнти узгодження); дисперсійний аналіз (одно-, дво-, багатофакторний); регресійний аналіз (проста регресія, множинна регресія, покрокова регресія, нелінійна регресія тощо.

STADIA — це набір сучасних та ефективних методів аналізу, який включає усі необхідні статистичні функції. STADIA yадає повний комплект ділової і наукової графіки: функції, залежності, розподіли, діаграми розсіяння, багатовимірні діаграми, карти, поверхні, обертання, сплайни, прогнози, гістограми, стовпчикові, вежі і кругові діаграми, дендрограми, установка розмірів, написів по осях і під малюнком, графічний архів, різноманітні перетворення і обчислення, імпорт/експорт даних і результатів в стандартний міжнародний формат (ASCII і DBF); розвинена екранна допомога, зрозуміла інтерпретація результатів, великий сервіс, до 64 000 чисел в матриці даних. Сервіс має розвинену систему контекстної екранної допомоги.

MS Excel — найбільш поширений додаток з пакета офісних програм MS Office, розроблений Microsoft Corp. MS Excel – це електронна таблиця з досить потужними математичними можливостями, де деякі статистичні функції є просто додатковими вбудованими формулами. MS Excel добре підходить для накопичення даних, проміжного перетворення, попередніх статистичних обчислень, для побудови деяких видів діаграм.

MATLAB — потужний пакет обробки даних, що являє собою комп’ютерну оболонку для інтерактивних та командних обчислень і візуалізації. Назва MATLAB розшифровується як Matrix Laboratory тобто Матрична Лабораторія. Розробником є MathWorks, Inc. Можливості програми покривають практично всі області математики. Наприклад, з допомогою MATLAB можна провести статистичний аналіз даних з використанням цифрової фільтрації, статистичної регресії, включаючи побудову графіків, оптимізацію, пошук нулів, чисельне інтегрування. Додатково MATLAB дозволяють візуалізувати дані аж до побудови тривимірних графіків і створення анімованих роликів.

PAST — пакет програм для статистичного аналізу даних.

Посилання: Hammer, Ø., Harper, D.A.T., Ryan, P.D. 2001. PAST: Paleontological statistics software package for education and data analysis. Palaeontologia Electronica, 2001. – Vol. 4. – No. 1: 9pp. http://palaeo-electronica.org/2001_1/past/issue1_01.htm

G*Power — аналіз потужності статистичних критеріїв.

Посилання: Faul F., Erdfelder E., Buchner A., Lang A.-G. Statistical power analyses using G*Power 3.1: Tests for correlation and regression analyses // Behavior Research Methods, 2009. – Vol. 41. – P. 1149-1160 або Faul F., Erdfelder E., Lang A.-G., Buchner A. G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences // Behavior Research Methods, 2007. – Vol. 39. – P. 175-191

Instat+ — Статистичний пакет загального призначення.

LePAC — Статистичний аналіз експериментальних даних з фокусом на бейзівські методи.

Посилання:

GENEPOP — Прикладний пакет генетико-популяційних програм. Не потребує інсталяції.

Посилання: Rousset F. genepop’007: a complete re-implementation of the genepop software for Windows and Linux // Molecular Ecology Resources, 2008. – Vol. 8. – No. 1. – P. 103–106.

GenAlEx — Програма для генетичного аналізу в Excel.

Посилання:Peakall R., Smouse P.E. (2012) GenAlEx 6.5: genetic analysis in Excel. Population genetic software for teaching and research-an update // 2012. Bioinformatics, 2012 або http://bioinformatics.oxfordjournals.org/content/early/2012/07/20/bioinfor