蛇使いな彼女BLOG
【第55回】 データの補正について
2022.03.18
今日はデータの補正について詳しく説明していこうと思います。
補正には直線の一次式を使います。他社のエレベーションの変換にも一次式が利用されていることから、割とこの方法が一般的なようです(知らなかった!)
【補正式】
この式のxに元のデータを代入して補正後のデータを計算します。
との値はどうするかというと、以下のフローチャートに従って適切な値を導き出します。
このフローチャートは私の発表資料から抜粋したものですが、データの補間から最終的にコンターによる図化を行うまでの工程をまとめた資料です。
まず(1)の工程ですが、センサー交換日の前後で同じ時間帯の鉛直データを各1つずつ抽出します。
なぜ同じ時間帯かというと、水温・クロロフィル・PCYなど多くの項目は日周変動するので、補間を行う上でこのようなセンサー交換以外の誤差要因を排除するためです。
次に(2)では、
(1)で抽出した鉛直データ(図化するとわかりやすい)を比較します。
センサー交換前のデータと交換後のデータの分布が似ていればこれら2つのデータに相関関係があるか散布図を使って調べます。
散布図の直線近似式()からR2の値が±0.6以上であれば相関があると判断し、
(3)で直線式のxにスケールの低い方の生データを代入します。
±0.6未満であれば抽出した鉛直データが適切な組み合わせではなかったとし、(1)に戻ってもう一度同じ作業を行います。
センサーの項目によって多少の誤差はありますが、補間前↓は5/18以降確認しづらかった日周変動が、
補間後はこのようにはっきり浮き出ます。
今日紹介した補完方法は、センサーの個体差による誤差を修正してなるべくきれいなデータにしたいときに有効です。
結果を見ての通り、完璧に修正できるわけではありません(^_^;
ですが、きれいなデータに整えることはディープラーニングには欠かせない行程の一つなので、今後も検討していきたいと思います。
今回はここまでです♪