本日はデータフレームのマージ(結合) について。

これを実行するとこうなります。

pd.merge()関数は、2つのデータフレームの内、共通の列(今回はstock_code)を見つけると、それをキーにデータフレーム同士をマージします。ちなみに共通のキーがない行は削除されます。つまり、デフォルトでは内部結合になるんですね。もちろんオプションで外部結合することも可能です。

通常はこのようにキーとなる列を明示的に指定した方がよいでしょう。

ちなみにキーの列名が同じでも、型が異なる(この場合はintとstr)とマージできずにエラーになります。

このような場合はastypeで列の型をどちらかに合わせてからマージするようにします。(下記はstrに合わせた例です)

証券コードをキーにしておくことで、それぞれ別の情報源から取ってきた銘柄情報を一つのデータフレームにマージすることができます。マージには色々な機能というかオプションがありますが、ひとまずこれぐらいを覚えておけば銘柄分析に十分活用できますよ。

Pandas本はこれを辞書的に使うと徐々に知識が体系化できてきます。

 

Please follow and like us:

コメントをどうぞ

メールアドレスが公開されることはありません。

CAPTCHA


Social media & sharing icons powered by UltimatelySocial