Явления, происходящие в природе, в обществе, в человеке и технике очень сложны и разнообразны. Исследователи изучают разные стороны этих явлений, причем каждая наука вырабатывает свои специфические методы исследования. Например, таким важным социальным явлением, как преступность, занимаются не только юристы, но и социологи, психологи, медики и иные специалисты. Есть тут серьезная работа и для математиков. Их задача состоит в том, чтобы подвергнуть математической статистике огромный статистический материал: отчеты органов внутренних дел и другие документы, содержащие различные числовые данные. В этой лекции мы рассмотрим наиболее существенные сведения о статистических методах обработки информации.
Термин статистика употребляется чаще всего для обозначения двух понятий. Во-первых, статистикой называют набор количественных данных о некотором явлении, совокупности объектов и т.п. Эти данные называют статистическими.
Во-вторых, термином статистика объединяют совокупность методов исследования, основанных на анализе статистических данных.
В каждой области деятельности разработаны свои специфические статистические методы. Существует много разных статистик: социально-экономическая, демографическая, медицинская, юридическая, звёздная и ряд других. Поскольку всякая статистика оперирует с числами, то основой всех статистических методов является математика. Совокупность математических методов обработки, систематизации, анализа и использования статистических данных составляет предмет специальной науки – математической статистики. Именно математические методы в силу их объективности позволяют получать наиболее значимые результаты при обработке статистических данных. Глубина и достоверность этих результатов зависит как от мощности применяемых математических методов, так и от правильности их применения. Разумеется, достоверность результатов зависит также от доброкачественнности статистического материала, который подвергается обработке.
Математическая статистика тесно связана с теорией вероятностей. Обе эти математические дисциплины изучают массовые случайные явления. Связующим звеном между ними являются предельные теоремы теории вероятностей. При этом теория вероятностей выводит из математической модели свойства реального процесса, а математическая статистика устанавливает свойства математической модели, исходя из данных наблюдений (говорят "из статистических данных").
Предметом математической статистики является изучение случайных величин (или случайных событий, процессов) по результатам наблюдений. Полученные в результате наблюдения (опыта, эксперимента) данные сначала надо каким-либо образом обработать: упорядочить, представить в удобном для обозрения и анализа виде. Это первая задача.
Затем, это уже вторая задача, оценить, хотя бы приблизительно, интересующие нас характеристики наблюдаемой случайной величины. Например, дать оценку неизвестной вероятности события, оценку неизвестной функции распределения, оценку математического ожидания, оценку дисперсии случайной величины, оценку параметров распределения, вид которого неизвестен, и т.д.
Следующей, назовем ее условно третьей, задачей является проверка статистических гипотез, т.е. решение вопроса согласования результатов оценивания с опытными данными.
Одной из важнейших задач математической статистики является разработка методов, позволяющих по результатам обследования выборки делать обоснованные выводы о распределении признака изучаемых объектов по всей совокупности.