Простая регрессия

Простая регрессия: определение постоянной Хаббла

Процедура простой регрессии заключается в нахождении аналитического вы­ражения для связи двух переменных X и Y. Модели простой регрессии, пре­дусмотренные в STATGRAHICS Plus for Windows, представлены в табл. 2.1.

Статья 345 - Картинка 1

Таблица 2.1. Модели простой регрессии

Продемонстрируем процедуру поиска модели простой регрессии на приме­ре оценки постоянной в законе Хаббла. Сведения для этого примера почерп­нуты из работы Ю. Н. Тюрина и Г. И. Симоновой «Знаковый анализ линей­ных моделей // Обозрение прикладной и промышленной математики» (М.: изд-во ТВП, 1994).

Американским астрономом Хабблом в 1929 году было обнаружено, что га­лактики удаляются от Земли тем быстрее, чем дальше они расположены. Также им было установлено, что скорость удаления пропорциональна рас­стоянию. Коэффициент этой пропорциональности получил название постоян­ной Хаббла. О его точном значении в астрономии продолжается дискуссия, хотя сама идея линейной зависимости признана безусловно. В настоящее вре­мя указанное явление истолковывается как свидетельство расширения все­ленной.

Данные, которые мы подвергнем анализу, представляют собой расстояния от Земли (в миллионах световых лет) и скорости удаления (в сотнях миль в секунду) 11 галактик (табл. 2.2).

На рис. 2.12 отображены анализируемые измерения. Визуально рассмат­риваемые точки не лежат на одной прямой, но располагаются приблизительно вдоль некоторого направления.

Статья 345 - Картинка 2

Таблица 2.2. Исходные данные

Статья 345 - Картинка 3

Рис. 2.12. Графическое представление данных о созвездиях

Раскрываем электронную таблицу STATGRAPHICS и заносим в нее пред­ставленные выше измерения. Последовательно выделяем колонки и после на­жатия правой кнопки мыши выбираем из контекстного меню Modify Column. В предлагаемом окне диалога задаем имена переменных: distance (расстоя­ние) и speed (скорость). Вносим также в таблицу условные названия га­лактик. После проделанных операций сохраняем файл данных под именем Hubble: File | Save Data File As.

Вызываем процедуру построения моделей простой регрессии: Relate | Simple Regression. В появившемся окне диалога (рис. 2.13) выделяем снача­ла переменную distance и вводим ее в поле анализа Y нажатием кнопки со стрелкой, а затем переменную speed в поле анализа X. Нажимаем ОК.

На экран выдается рабочее поле процедуры простой регрессии со стати­стической сводкой применительно к линейной модели (рис. 2.14).

Как следует из полученной сводки, построена очень неплохая модель, сильно коррелирующая с экспериментальными наблюдениями (коэффициент корреляции 0.9986). Исходя из модели, угол наклона (slope) составляет 2.82 — а это и есть постоянная Хаббла.

Статья 345 - Картинка 4

Рис. 2.13. Окно диалога для ввода данных в процедуру построения моделей простой регрессии

Статья 345 - Картинка 5

Рис. 2.14. Сводка результатов построения линейной модели

Для графического отображения результатов нажимаем кнопку графи­ческих опций (третья слева в нижнем ряду кнопок). На экране появляется окно диалога с доступными в данной процедуре графическими вариантами (рис. 2.15). Устанавливаем флажки Plot of Fitted Model(график подобран­ной модели) и Residual versus X (график остатков). Нажимаем ОК. Получа­ем следующие картинки (рис. 2.16).

Обращает на себя внимание нижний график остатков. Полученная кар­тинка призывает задуматься, так как напрашивается наличие какой-то периодической компоненты в анализируемых измерениях. Является ли она следст­вием использованной технологии измерений или имеется другая причина — тут есть повод для поиска объяснений.

В целом же мы подтвердили гипотезу Хаббла о линейной зависимости ско­рости удаления звезд от их расстояния до Земли и получили значение посто­янной Хаббла, хорошо согласующееся с известными данными. Вместе с тем, для иллюстрации дополнительных возможностейSTATGRAPHICS проделаем следующие операции.

Статья 345 - Картинка 6

Рис. 2.15. Варианты графического отображения

Статья 345 - Картинка 7

Рис. 2.16. Графические отображения результатов регрессионного моделирования

Нажмем кнопку табличных опций (вторая слева в нижнем ряду кнопок) и установим флажок Comparison of Alternative Models (сравнение альтерна­тивных моделей). Нажмем ОК. Получаем таблицу, в которой представлены результаты анализа для всех типов зависимостей Y от X, упорядоченные по коэффициенту корреляции с экспериментальными наблюдениями (рис. 2.17).

Оказывается, что линейная модель занимает только третье место по каче­ству аппроксимации экспериментальных наблюдений. На первое место вышла модель с дважды обратным преобразованием, а второе место захватила мультипликативная модель.


Статья 345 - Картинка 8


Рис. 2.18. Сводка регрессионного анализа для модели с дважды обратным преобразованием


Статья 345 - Картинка 9


Рис. 2.17. Результаты сравнения альтернативных моделей


Однако их преимущество столь незначительно, что вряд ли стоит здесь гнаться за иллюзорной точностью в ущерб лаконичности гипотезы линейного расширения Вселенной. Хотя, кто знает? У модели с два­жды обратным преобразованием стандартная ошибка оценки составляет всего 0.000514, а у линейной модели эта величина значительно больше -18.325. Взгляните и сравните сами (рис. 2.18).