人工知能による系外惑星の検出とその限界

ケプラー宇宙望遠鏡の「K2ミッション」のデータから、人工知能(ニューラルネットワーク)を用いて惑星候補を探す研究が行われました。研究では新たに2つの惑星が見つかった一方、人工知能が万能ではない事実も浮き彫りになりました。

※この記事では惑星の発見以外の内容について解説しています(惑星発見については別記事りあります)。


「ケプラー」宇宙望遠鏡や「TESS」衛星は、系外惑星のトランジット(惑星が恒星の手前を横切り光度が減少すること)を探すために恒星の光度を記録しています。

変光が見つかった場合、それがさらなる研究に値する「惑星候補」なのかあるいは「誤検知」なのかを、その変光のパターンから判定しなければなりません。

このプロセスに、近年応用が広まっているニューラルネットワーク(人工知能)を活用しようという研究が進められています。ケプラーの主要ミッション(2009~2014年)ではニューラルネットワークを使わない自動判定を用いていましたが、その後ニューラルネットワークを用いた判定システムがいくつか開発されました。

一方でケプラーの延長ミッションにあたる「K2ミッション」(2014年~2018年)では、この種のシステムは実用化されていません。

今回の研究

今回テキサス大学オースチン校に所属する Anne Dattilo 氏らがarXivに投稿した研究(リンク)は、ディープラーニングを用いたニューラルネットワーク(人工知能)をK2ミッションのデータに適用しています。

研究で用いられたニューラルネットワーク「AstroNet-K2」は、過去にケプラー主要ミッション向けに開発された「AstroNet」を改良したものです。

学習と評価

研究チームはまず、K2ミッションが記録した恒星の光度データから、惑星トランジットの可能性がある変光「TCE」(Threshold Crossing Event) を抜き出してデータセットを作成しました。

次に、変光のパターンに基づく従来手法で個々のTCEを「惑星候補」「誤検知」「分類不明」に分け、分類不明なものをデータセットから除外しました。そしてデータセットのうちテスト用と確認用を除くサブセット(2万2105個のTCE)を人工知能の学習に用いました。

能力の評価には、TCEデータセットから1割(2755個)を抜き出したテスト用のサブセットを使いました。判定はそれぞれのTCEについて0~1の間のスコアで出力されます。これが高ければ「惑星候補」である可能性が高く、低ければ「誤検知」である可能性が高いことになります。

結果は閾値によって「惑星候補」と「誤検知」に切り分けられます。これが従来手法による分類と一致するかどうかを調べました。

単独では使えない

スコア0.5を閾値とした場合、97.84%のTCEが正しく分類されました。この数字は人工知能単独で惑星候補を分類するには不十分なものです。TCEのデータセットの中には惑星候補より誤検知の方が多く存在するため、この精度では本来誤検知であるべきものが惑星候補に分類される事例(=惑星候補への誤検知の混入)が多すぎます。

閾値を上げてスコアが1に近いものだけを惑星候補に分類すれば、誤検知が惑星候補に混入することは無くなります。しかしその場合、本来惑星候補と分類するべきTCEの8割を誤検知として取り逃す結果になりました。

補助的手段として

以上の結果は、人工知能独力での分類は現時点では不可能なことを示しています。しかし人間の判断を介した分類の手助けとしては役に立ちそうです。

判定が0に近いもののみを誤検知として取り除いた場合、残されたTCEのリストは誤検知が未だ混在していますが、ここから先のプロセスを従来の(人間の判断を介した)手法に任せることが考えられます。

前述のようにTCEには惑星候補より多くの誤検知が含まれているため、最初に人工知能を利用して誤検知のふるい落としを行えば労力の削減になります。

未知の現象への無力さ

研究チームはまたニューラルネットワークの重要な限界についても記述しています。ニューラルネットワークは学習したパターンの識別には役に立ちますが、未知あるいは特殊なパターンにはほとんど無力です。

K2ミッションで見つかった特殊な惑星の例は、「K2-22b」や「WD 1145+017 b」といった「分解中の惑星」です。これらは放出される塵によってトランジットごとに減光の大きさが変化します。研究チームが人工知能に判別させたところ、この2つの系は「誤検知」として処理される可能性が高い(非常にスコアが低い)という結果になりました。

また、トランジット惑星の中にはトランジットの間隔が変動するもの(TTVを示すもの)が存在します。この変動の振幅が大きく、なおかつ観測期間中に単調でない変動パターンが生じる稀なケースで、惑星候補を誤って誤検知に分類する問題も見つかりました。

惑星の発見

研究チームは今回のモデルの実用例として、データセットに採り入れなかったTCEを集めて別のデータセットを作成し、ニューラルネットワークに採点させました。そして特に高いスコアを記録したTCEのうち、これまでに知られていなかった2つについてフォローアップ観測を行い、新たに惑星と確認しました。

これに関しては以下の記事で記述しています。

関連記事:人工知能がK2のデータから2つの惑星を発見


今回の研究は、誤検知のふるい落としや有望な候補の選抜という用途に人工知能(ニューラルネットワーク)は役に立つものの、惑星候補の完全な分類には人力が必要なことを示しています。また、人工知能は価値ある未知の現象を見つけ出すことができませんでした。

人工知能を有効に活用していくためには、これらの欠点を押さえた上で、従来手法や人間の判断と適切に組み合わせていくことが必要です。

Dattilo氏らの研究は2019年3月25日にarXivに投稿され、27日に公開されました。コメントによると研究は『アストロノミカル・ジャーナル』に受理され掲載予定ということです。

(4/13追記)4月9日に正式に掲載されています(AJ 157, 169)。

参考文献

  • Dattilo, A. et al., 2019, “Identifying Exoplanets with Deep Learning II: Two New Super-Earths Uncovered by a Neural Network in K2 Data”, AJ 157, 169. (arXiv:1903.10507v1)

関連記事

更新履歴

  • 3/30 関連記事を追加
  • 4/13 追記

コメントを残す

メールアドレスが公開されることはありません。