Кількість сигарет, що викурюються за день
Мал. 9.2. Регресія, що представляє залежність ваги новонародженого від ступеня пристрасті майбутньої матері до паління
Наприклад, в рівнянні (9.7) / -Статистика для коефіцієнта при фіктивної змінної становить 1,23. Таким чином, коефіцієнт незначимо від- личается від нуля, що означає, що зсув ліній регресії для первістків і де- тей, народжених не першими, не є значимим. Це можна пояснити малим розміром вибірки. Ефект, що викликається тим, що дитина - первісток (або непервенец), проявляється тільки як тенденція, і він зовсім невелика, щоб можна було виявити його значимість за вибіркою, що містить тільки 20 спостережень. Якщо ми розглянемо регресію на реальних даних, то уви- дім, що / -Статистика становить 4,58, а це вказує, що в действітельно- сти зрушення лінії регресії дуже значущий.
Приклад з временнимрядом
У табл. 9.2 можна бачити, що в 1974 р спостерігалося різке зниження расхо- дов на автомобілі. Мав місце нафтова криза, і таке зниження було одним з його результатів. Однак згодом витрати на автомобілі нача чи знову зростати. Отже, ми можемо висунути гіпотезу, що функція попиту в 1974 р зрушила вниз, як показано на рис. 9.3, де у - витрати на автомобілі і х - наявний особистий дохід.
Ми можемо висловити це зрушення математично, ввівши в рівняння фіктивної ву змінну Д приймаючи її значення рівними нулю для 1963-1973 рр. і одиниці для 1974-1982 рр .:
Витрати на автомобілі в 1963-1982 рр. (Млрд. Дол. В постійних цінах 1972 г.)
Джерело: той же, що і в табл. Б. 1.
Для періоду 1963-1973 рр. при D = 0 рівняння набуває вигляду:
>> = <х + рх + и,
а для періоду 1974-1982 рр. при D = 1:
Коефіцієнт 5 при фіктивної змінної, звичайно, негативний. У разі оцінювання функції попиту за даними для у і JC з табл. Б. 1 і значень Д які представляють собою ряд з 11 нулів, за якими йдуть 9 одиниць, по- отримуємо:
Дайте повну інтерпретацію регресії і виконайте відповідні ста- статистичні перевірки.
9.3. Ви досліджуєте залежність між витратами на закордонні поїздки і розташовуються особистим доходом для Франції, використовуючи щорічні дані за період 1966-1985 рр. Протягом 1982-1983 рр. уряд Франції значи- тельно обмежило норми використання іноземної валюти для цієї мети з тим, щоб зменшити дефіцит платіжного балансу. Поясніть, як би ви використовували фіктивну змінну для оцінки ефективності введення цих обмежень.
9.2. Загальний випадок
Одним із шляхів такого дослідження, звичайно, було б використання моделі:
y = a + p x x + p 2 z + u,
де z - число попередніх пологів. Однак ця модель внутрішньо виходить з того, що вага новонародженого зростає як лінійна функція від z, т. Е. З по- стояв збільшенням на кожні додаткові попередні пологи. А це в общем-то саме по собі не є очевидним. З фізіологічних причин було б природним припускати, що другі або наступні пологи бу- дуть мати відносно невеликий додатковий ефект.
рівними нулю, і виходить рівняння:
у = 3373 - 7,8 * + 127 = * 3500 - 7,8х.
Поліпшення якості рівняння / Використані ступеня свободи
Непояснена дисперсія / Число залишаються ступенів свободи
Вона розподілена з 3 і 959 ступенями свободи і перевищує критичний зна чення F, рівне 5,42 при рівні значимості в 0,1%.
новонародженого в дійсності зменшується при більш високому числі попередніх пологів, але несуттєво.
Пастка при застосуванні фіктивних змінних
Використання сезонних фіктивних змінних
Дослідники, що використовують дані часових рядів, в цілому предпо- Новомосковскют погодовой даними відомості по кварталах по тій простій причині, що за рахунок цього вони отримують в 4 рази більше спостережень у розглянутий період. Разом з тим іноді помітний вплив на залежність надає се-зонний фактор. У цьому випадку бажано безпосередньо прийняти його у вни-
гу. Якщо не враховувати цей вплив, то воно вносить свій внесок в випадок-ний член і «шум» в рівнянні, в результаті чого відбувається непотрібне знижений-ня ефективності оцінок інших коефіцієнтів.
Витрати споживачів на газ і електрику в США (млрд. Дол. В постійних цінах 1972 р .; без сезонної поправки)
У табл. 9.4 представлені витрати споживачів на газ і електрику в США
в постійних цінах з I кварталу 1977 р IV квартал 1982 г. Слід звернути увагу, що для позначення кварталів року використовуються римські цифри I-IV. Ряд характеризується невеликою тенденцією до підвищення і сильними се- зонними коливаннями. Як і слід було припускати, витрати такого роду завжди значно вище взимку, ніж влітку.
у = а + р / + b 2 D 2 +5 3 Z> 3 + b 4 D 4 + u,
де D 2. D 3 і D 4 - фіктивні змінні, які визначаються наступним обра- зом: видання 2 дорівнює одиниці, коли спостереження відноситься до II кварталу, і нулю в інших випадках; /) 3 дорівнює одиниці в III кварталі і нулю в інших випадках; D 4 дорівнює одиниці в IV кварталі і нулю в інших випадках.
Повна сукупність спостережень за витратами на газ і електрику, дан ні про час і фіктивні змінні наведені в табл. 9.5. Оцінивши рег- рессіонную залежність витрат від часу і фіктивних змінних, по- отримуємо:
у = 7,50 + 0,030 / - 2,78Д 2 -2,58Z) 3 - 2,19Z> 4;
Рівняння (9.28) можна графічно проілюструвати (рис. 9.4). (Сліду- ет відзначити, що в цьому конкретному випадку тимчасової тренд настільки не- значний, що лінії виявляються майже горизонтальними.)
При бажанні можна використовувати оцінену регресію для отримання оцен- ки сезонних коливанні в кожному кварталі. Вираз (9.28) дає чотири від- слушні лінії регресії. Усереднюючи їх, отримуємо:
Відстань між окремою лінією регресії для будь-якого кварталу і усред- ненной лінією, яке представлено різницею значень постійного члена