Статистический анализ и планирование измерений лучевых скоростей внесолнечных планетных систем Р. В. Балуев

реклама
Статистический анализ и планирование
измерений лучевых скоростей
внесолнечных планетных систем
Р. В. Балуев
Санкт-Петербургский
государственный университет
Санкт-Петербург, ИПА РАН
11 февраля 2009 г.
Введение
Внесолнечная планета, экзопланета – планета,
обращающаяся вокруг звезды, отличной от
Солнца (т.е. вне Солнечной системы)
Первое открытие (планета у звезды 51 Pegasi):
M.Mayor & D.Queloz 1995, Nature, 378, 355
“ A Jupiter-mass companion to a solar-type star”
Введение
Известно более 300 внесолнечных планет
Около 30 внесолнечных планетных систем, содержащих две
планеты или более
С
учетом наблюдательной селекции доля многопланетных
систем может составлять 50% (Wright et al,, 2009, ApJ, in press)
Разнообразие самих планет и их систем весьма велико
Большинство
экзопланет (около 80%) открыто методом
лучевых скоростей
Из
остальных 20% большая часть открыта методом
прохождений с последующим подтверждением методом
лучевых скоростей

Схема поставленных задач
Выделение (поиск) периодических компонент в наблюдательных
данных:

•

нужен эффективный метод оценки статистической значимости
пиков периодограмм
Алгоритмы оценки масс и орбитальных параметров экзопланет:
• нужен
правильный учет эффективного дрожания лучевых
скоростей звезд
нужен анализ возможных систематических ошибок измерений
Алгоритмы планирования наблюдений:
• нужно обоснованно выбирать даты для будущих наблюдений
лучевых скоростей
•
Практическое применение разработанных методов обработки и
планирования к конкретным массивам наблюдений лучевых
скоростей

1. Поиск периодичностей
Первый этап анализа временного ряда лучевых
скоростей – поиск в нем периодических компонент,
потенциально соответствующих обращающимся вокруг
звезды планетам.
Наиболее важный количественный результат такого
анализа – предварительная оценка периода найденного
колебания.
Периодограмма Ломба-Скаргла
  

(
t
,

,
a
,
b
)

a
cos

t

b
sin

t
.
2
x

(
t
,
,
a
,
b
)

,
D

i
i
i
i,
Временной ряд (ti, xi, σi)
Присутствует ли в наблюдаемых данных периодичность
указанной функциональной формы?
2
1


(f,a
,b
)
x


(
t
,


2

f
,
a
,
b
)
,

i
 i
N
2
МНК:
i
1
2
i
2
1
Nx

2
i
z
(f)
min
(f,a
,b
)
.

2


i
a
,
b
2
1
i

Классический вид периодограммы Ломба-Скаргла



2
2
x
i
 xi2cos


(
t


)
sin

(
t


)
2


i
i
1
 


i
i
z
(f) 1 2
 1 2
,

2

(
ti

) 

(
ti

)

2cos
2sin


i
 i

1
2

ti
2sin


i
tg
2

 1
.
2

ti
2cos


i
Обобщения периодограммы Ломба-Скаргла
Модель сигнала не обязательно должна быть
синусоидальной
•Можно ввести некоторую базовую модель сравнения:
константу, линейный или полиномиальный тренд.
Общее определение линейных МНК-периодограмм:
•

(
t,f,θ
)
θ

(
t,f),
dim
θ

d
,

(
t,θ
)
θ

(
t),
dim
θ

d
,
H
H
H
H
H
H

(
t,θ
,θ
)

(
t,f,θ
)

(
t,θ
),
d

d

d
K
H
H
H
K
H
,
1
2
2

z
(f)
min

(
θ
)

min

(
f
,
θ
,
θ
)
.

H H
K
H
θ
,θ
H
H
θ

2
Важный частный случай – мультигармонические
периодограммы. В этом случае модель сигнала задается
отрезком ряда Фурье. Такие периодограммы лучше
приспособлены для поиска сильно несинусоидальных
сигналов
(пример:
кривые
блеска
затменных
переменных звезд).
Обобщения периодограммы Ломба-Скаргла
Дисперсии ошибок часто неизвестны. Обычно можно
задать только последовательность статистических
весов wi∞1/σi2. В этом случае сами функции χ2 нельзя
вычислить, но можно вычислить их отношения. Это
позволяет построить следующие модифицированные
периодограммы:
N
N
H
K
z
(
f
)

z
(
f
),
z
(
f
)

z
(f),
1
2
2
2
min

(
θ
)
min

(f,θ
,θ
)
H
H
K
H
θ
H
2
min

(
θ
)
H
H
N
θ
K
H
z
(
f
)

ln
,
3
2
2 min

(f,θ
,θ
)
K
H
θ
,θ
H
N

N

d
,
H
H
N
N

d
.
K
K
θ
,θ
H
Статистическая значимость пиков
периодограмм
Из-за случайных ошибок измерений периодограммы
всегда содержат некоторый шумовой компонент. Нужно
уметь вычислять не только периодограмму, но и
статистическую значимость наблюдаемых пиков.
Вероятность ложной тревоги: вероятность, того что
наблюдаемый на периодограмме максимальный пик мог
быть произведен случайными ошибками наблюдений.
Чем меньше вероятность ложной тревоги, тем выше
статистическая значимость.
Статистическая значимость пиков
периодограмм
Все используемые на практике методы вычисления
вероятности ложной тревоги так или иначе требуют
численного моделирования методом Монте-Карло.
Формула “кратных испытаний” (Horne & Baliunas, ApJ,
1986, V. 302, P. 757):
N
(
f
)
ind
max
FAP
(
z
,
f
)

1

(
1

FAP
(
z
))
max
max
single
Для периодограмм, вычисляемых на непрерывном
отрезке частот, эта формула не верна ни в общем
случае, ни даже в каком-либо асимптотическом
приближении. Представляет собой лишь эвристическую
однопараметрическую
аппроксимацию
(Frescura,
Engelbrecht, Frank, MNRAS, 2008, V. 388, P. 1693).
Параметр
Nind
(“число
независимых
частот”)
оценивается по результатам моделирования МонтеКарло.
Как определить функцию распределения
экстремальных отсчетов случайных
процессов требуемого класса?
Davies R.B. Hypothesis testing when
parameter is present only under alternative.
1977, V.64, P.247-254
Davies R.B. Hypothesis testing when
parameter is present only under the
Biometrika, 1987, V.74, P.33-43
Davies R.B. Hypothesis testing when
parameter is present only under alternative –
case. Biometrika, 2002, V.89, P.484-489
a nuisance
Biometrika,
a
nuisance
alternative.
a nuisance
linear model
Статистическая значимость пиков
периодограмм
Вероятность ложной тревоги для линейных МНКпериодограмм общего вида
FAPmax ( Z , f max ) 
  ( Z , f max )  FAPsingle( Z )

e  z z  2

N K 1
d 1
 ( N H 2)
2 z1 2
2 z1
2

1

A( f max )   ( ( N K 1) 2 ) N H
NH


N
d 1
1 2H

(
N
2
)
2
z
2
z
2
2
1  N K2
  ( ( N KH1) 2 ) N K2
d 1
2 n 3
  ( N H 2) 2
z3 2  z3 1 2 N K 
  ( ( N K 1) 2 )  sh N K e
d 1
  
  




Периодограммы вычисляются в частотном диапозоне [0,fmax]
A(fmax) обычно приблизительно пропорциональна fmax.
Статистическая значимость пиков
периодограмм
Вероятность ложной тревоги для мультигармонических
периодограмм степени n (для периодограммы ЛомбаСкаргла и ее нормализаций n=1):
z n2

e z
NK1
 (NH 2) 2z1 n12
2z1
2
1


NH
 ((NK 1) 2) NH
NH
 nW (NH 2) 2z2 n12
2z2 1 2
1 NK
 ((NK 1) 2) NK
1
2n3
 (NH 2)
z3 n2 z3 12NK 
e

((NK 1) 2) 2sh NK
n
2n
(1)nk k2n1
n 

(2n 1)!! k1 (n  k)!(n k)!
1 1, 2 1.556, 3 1.062, 5  0.136
1
  
  




W  fmaxTeff
Teff – некоторая эффективная длина временного ряда (обычно
близка к его действительной длине)
Периодограммы вычисляются в частотном диапозоне [0,fmax]
Практическая эффективность оценок
Моделированные и теоретические кривые FAP(z) для мультигармонических
периодограмм z(f) при n=1,2,3,5.
W=50
N=100 с периодическими
пропусками
W=500
N=30 равн.случ.
W=5000
N=100 равн.случ.
Практическая эффективность оценок
Моделированные и теоретические кривые FAP(z) для мультигармонических
периодограмм z1(f) при n=1,2,3,5.
W=50
N=100 с периодическими
пропусками
W=500
N=30 равн.случ.
W=5000
N=100 равн.случ.
О формуле кратных испытаний
Для обычной периодограммы Ломба-Скаргла имеем:
формула кратных испытаний: FAPmax ( z, f max )  N ind ( f max )e  z
граница Дэвиса:
FAPmax ( z, f max )  We  z z

Первая формула даёт систематическое уклонение при
больших z. На практике коэффициент Nind
оценивается
из
результатов
Монте
Карло
моделирования, которые могут покрыть лишь
ограниченный диапозон умеренных значений FAP.
Следовательно,
формула
кратных
испытаний
систематически недооценивает малые значения FAP,
и поэтому ее применение на практике опасно
(благоприятствует “ложным тревогам”).
RV of α Cen B [m/s]
2. Дрожание лучевой скорости
(radial velocity jitter)
M. Mayor et al., The
Messenger, 2003,
114, 20 Setting new
standards
with
HARPS
time [hours]
Эмпирические модели дрожания
J.T. Wright, PASP, 2005,
117, 657-664
“ Radial velocity jitter in
stars from the California
and Carnegie planet
search at Keck
observatory”
Переход к методу максимального
правдоподобия
Переход к методу максимального
правдоподобия
Максимизацию функции правдоподобия в данном случае можно
довольно эффективно выполнить при помощи обычных (лишь
слегка модифицированных) методов нелинейной χ2-минимизации
(например, метода Левенберга-Марквардта-Гаусса).
Этот
подход можно использовать при оценке планетных
параметров, статистическом сравнении различных орбитальных
моделей (проверке статистических гипотез), при поиске
периодичностей, ...
Часто
собственная дисперсия л.ск. одной и той же звезды
сильно различается для разных обсерваторий. Указываемые
самими наблюдателями погрешности л.ск. могут значительно
недооценивать, а иногда и переоценивать действительные
ошибки измерений.
Таким
образом, разработанный метод учета дрожания л.ск.
будет наиболее эффективен для совместного анализа
разнородных массивов данных, полученных на разных
обсерваториях.

Radial velocity (m/s)
Периодические систематические ошибки
RV residuals for
51 Pegasi
Амплитуды годичных гармоник
Спектрографы ELODIE (OHP), CORALIE (ESO): 5-15 m/s <=
неполное исключение теллурических линий из спектра
сравнения (M. Mayor)


Спектрограф HARPS (ESO): отсутствует
Обсерватории Lick, Keck: обычно отсутствует, иногда до 35 м/с <= (1) неточность приведения (до 2006-2007 г.)
лучевой скорости к барицентру Солнечной системы (J.T.
Wright), (2) годичная переменнось (неясного происхождения)
в форме спектральных линий (A. Quirrenbach)


Телескоп Хобби-Эберли: 5-10 m/s (причины неясны)
Пример: HD 74156
RV residuals for
HD74156
(From The Extrasolar Planets Encyclopaedia by J.Schneider)
Пример: 55 Cnc
RV residuals
for 55 Cancri
3. Планетная система HD37124
Резонанс 2:1!
1800
0.5 ред. к
0.3±0.3


900
0.5 ред. к
0.3±0.1
Динамическая устойчивость достигнута искуственно путем
принятия малого значения эксцентриситета ec~0.2. “Естественные”
оценки ec~0.5 соответствуют неустойчивым конфигурациям
системы.
Добавление в модель лучевой скорости годичных гармоник
(раздельно для данных ELODIE и Keck) с последующей редукцией
смещения позволяет достичь устойчивой конфигурации.
Резонансные конфигурации HD37124
рез. 2/1
рез. 5/2
4. Оптимальное планирование наблюдений
Зачем это нужно?
На сегодня известно около 30 внесолнечных планетных
систем, содержащих две планеты или более
(+) Ряд систем показывают замечательную динамику
планет: резонансы 2/1 (GJ876, HD82943, HD73526), 3/1
(55 Cnc b & c), и быть может 1/1 (HD82943? HD128311?);
апсидальные коротации (GJ876, ups And, ...?);
(+)
Резонансные
системы
могут
«запомнить»
существенную информацию о физических процессах,
имевших место в ходе их образования (см. напр.,
Beaugé et al., MNRAS, 2006)
(-) Конфигурации орбит во многопланетных системах
часто определяются слишком плохо
(-)
Именно в случае резонансных конфигураций
погрешности значений орбитальных параметров и масс
планет наиболее велики.
Некоторые неразрешенные вопросы
HD82943: Если эта система в резонансе 2/1, то
захвачена ли она в апсидальную коротацию?
Находится ли она в резонансе 2/1 или 1/1?
HD73526: Вероятно, резонанс 2/1, но оценки масс и
параметров орбит планет чрезвычайно ненадежны.
HD128311: Резонанс 2/1 или 1/1?
HD37124:
Орбитальная конфигурация определяется
плохо.

Некоторые неразрешенные вопросы
Возникают ситуации двух типов:
Недостаточность точности масс и орбитальных
параметров планет системы
Неоднозначность, связанная с наличием нескольких
альтернативных качественно различных орбитальных
моделей системы

В какие моменты времени следует
проводить новые измерения лучевой
скорости, чтобы ответить на
возникающие вопросы максимально
быстро?
Почему эффективность наблюдения может
существенно зависеть от его момента?
Здесь кривая слабо
чувствительна к
малым изменениям
параметров
Здесь кривая лучевой скорости наиболее
чувствительна к малым изменениям
параметров.
Уточнение оценок
Когда
нужно
проводить
новые
наблюдения, чтобы максимально
увеличить
точность
оценок
параметров планет системы?
Информация Шеннона в
Информационная матрица
приближении больших N:
Фишера, связанная с
вектором параметров θ:
(μ – модель лучевой скорости, а σmeas
– полные погрешности измерений)
Ковариационная матрица
оценок C асимптотически
выражается как C=Q-1.
Так называемый критерий D-оптимальности:
Нужно определить, насколько “D-информация” det Q увеличится
после выполнения наблюдения в заданный момент t.
Момент t, соответствующий максимальному росту Dинформации и является оптимальным моментом наблюдений.
Уточнение оценок
Существует классический способ
прямого вычисления определителей.
избавиться
от
На основе текущих оценок θ и модели лучевой
скорости μ(t,θ) можно построить предсказание лучевой
скорости звезды на любой момент времени в будущем.
Это предсказанное значение будет содержать
некоторую случайную ошибку.
Максимизация det Q эквивалентна максимизации
дисперсии
предсказания
лучевой
скорости,
вычисленной в линейном приближении как
(C=Q-1 is the variance-covariance
matrix of θ)
При этом удобно ввести безразмерную
функцию
J2(τ) = (det Q)after/(det Q)before=1+(σpred/σmeas)2
целевую
Дискриминация моделей
Когда
нужно
проводить
новые
наблюдения, чтобы максимально
эффективно отклонить одну из двух
альтернативных моделей?
Можно использовать следующую функцию, которая
представляет собой приближение дискриминационной
информации Куллбака-Лайблера:
Здесь v1 и v2 – предсказания лучевой
скорости звезды, вычисленные в рамках
первой или второй орбитальной модели, а σ1
и σ2 – их полные погрешности.
Пример: GJ876, уточнение оценок
Пример: HD208487, дискриминация моделей
5. На защиту выносится:
1.Новый эффективный метод оценки статистической значимости
периодичностей, выявляемых при помощи периодограммы
Ломба-Скаргла и ее обобщений.
2.Алгоритм учета кажущегося дрожания лучевых скоростей звезд,
основанный на методе максимального правдоподобия и
позволяющий находить более точные и надежные оценки
параметров планет.
3.Обнаружение систематических ошибок годичного периода в
современных программах поиска экзопланет методом лучевых
скоростей.
4.Применение разработанных алгоритмов обработки данных к
опубликованным измерениям лучевой скорости звезды HD37124,
вокруг которой обращаются три планеты-гиганта. Обоснование
того, что две внешние планеты этой системы могут двигаться по
орбитам с довольно большими эксцентриситетами, не нарушая
динамической устойчивости.
5.Алгоритмы оптимального планирования наблюдений лучевых
скоростей
в
программах
поиска
экзопланет,
наиболее
эффективные для многопланетных систем, особенно при наличии
резонансов.
6. Основные публикации
Baluev R. V., 2008, “Assessing the statistical significance of periodogram
peaks”, Mon. Not. R. Astron. Soc., V.385(3), P.279-1285

Baluev R. V., 2008, “Optimal strategies of radial velocity observations in
planet search surveys”, Mon. Not. R. Astron. Soc., V.389(3), P.1375-1382

Baluev R. V., 2008, “Resonances of low orders in the planetary system of
HD37124”, Celest. Mech. Dynam. Astron., V.102(4), P.297-325

Baluev R. V., 2009, “Accounting for velocity jitter in planet search surveys”,
Mon. Not. R. Astron. Soc., doi:10.1111/j.1365-2966.2008.14217.x

Baluev R. V., 2009, “Detecting non-sinusoidal periodicities in observational
data using multi-harmonic periodograms”, Mon. Not. R. Astron. Soc.,
submitted, arXiv:0811.0907

Балуев Р. В., 2009, “О поиске периодических компонент
наблюдательных данных”, Вестн. СПбГУ, Сер. 1, Вып. 2, в печати

в
Скачать