日本企業の決算データを取得する方法

機械学習を用いて株式相場の予測を行いたい、そう考えていざ始めようとした場合にデータをどこから入手するか悩む人も少なくないのではないでしょうか? ここでは、各社の決算データを取得する様々な方法を調べいくつか列挙してみました。

実際にデータを取得できた方法

決算プロを利用

決算プロとは無料で決算短信等をダウンロードすることができるwebサイトです。こちらのページをご覧の方々の中には既にこのサービスを利用したことがある方もいらっしゃるかもしれませんが、最初はこのサービスを利用することをおすすめします。

取得できるデータ(四半期ごとのデータ)

  • 基本情報とその他
    • 証券コード
    • 企業名
    • 会計基準(日本基準か米国基準か)
    • 連結個別(連結決算か個別決算か)
    • 名寄前勘定科目
  • 決算時期と決算期間と情報公開・更新日
    • 決算期(例:20XX年3月期)
    • 決算期間(第1四半期、第2四半期、第3四半期、通期)
    • 期首(例:20XX/4/1)
    • 期末(例:20XX/3/31)
    • 情報公開または更新日
  • 売上と利益
    • 売上高
    • 営業利益
    • 経常利益
    • 純利益
    • 一株当たり純利益
    • 希薄化後一株あたり純利益(欠損値多し)
  • 資産
    • 純資産または株主資本(欠損値多し)
    • 総資産(欠損値多し)
    • 一株当たり純資産(欠損値多し)
  • キャッシュフロー
    • 営業キャッシュフロー(欠損値多し)
    • 投資キャッシュフロー(欠損値多し)
    • 財務キャッシュフロー(欠損値多し)

まとめ

  • 無料
  • まずはこれを試してみよう

KABU+を利用

KABU+は、株価データ・投資指標データ等の株式投資関連データを配信する東証公認の情報サービスです。決算以外にも株価等のデータを入手することができます。注意点としては、決算プロでは四半期ごとの決算の情報を入手することができますが、KABU+の決算データは年単位のデータとなります(月単位のファイルをダウンロードすることができるが、中身は1年間同じ値が入っている)。また、分析結果をSNSやブログ・Webサイトで公開する場合、プランによって配信回数や配信ユーザー数に上限が設けられています。詳細は以下のリンクから確認してください。

https://kabu.plus/document/membership.pdf

取得可能な決算データ(毎年のデータ)

  • 基本情報とその他
    • 証券コード
    • 企業名
  • 決算時期
    • 決算期
    • 決算発表日
  • 売上と利益
    • 売上高
    • 営業利益
    • 経常利益
    • 純利益
  • 資産と資本
    • 総資産
    • 自己資本
    • 資本金
    • 有利子負債
    • 自己資本比率
    • ROE(自己資本利益率=純利益÷自己資本×100)
    • ROA(総資産利益率=純利益÷総資産×100)
    • 発行済株式数

取得可能な決算以外のデータ

  • 上場年月日
  • 信用取引(毎週)
  • 株価(毎日)
  • 株価と詳細な情報(毎日)
  • 日証金 融資・貸株残高(毎日)
  • 日証金 逆日歩銘柄(毎日)
  • ETF(毎日)
  • FUND(毎日)
  • REIT(毎日)

まとめ

  • データを個人利用するだけではなく、データの分析結果を公開したい場合は会員プランの内容をよく確認する

四季報CD-ROMからデータを抽出

こちらの方法は四季報CD-ROMからデータを抽出し、Excel化する方法になります。 具体的な方法はリンク先のサイトにてご確認ください。

取得可能なデータ

  • 基本情報
    • 証券コード
    • 企業名
    • 会計方式
  • 決算時期と期間
    • 決算期
    • 決算月数
  • 売上と利益
    • 売上高
    • 営業利益
    • 経常利益
    • 純利益
    • 一株あたり純利益
  • 資産
    • 純資産
    • 総資産
    • 修正後一株当たり純資産
  • キャッシュフロー
    • 営業キャッシュフロー
    • 投資キャッシュフロー
    • 財務キャッシュフロー
  • ここでは紹介しきれないほど多くのデータを取得できます!

参考にしたサイト

まとめ

  • CD-ROMからデータを抽出する作業が面倒
  • 抽出したデータのフォーマットが崩れる場合がある

EDINETから取得

EDINETでは過去5年分ほどの決算短信のデータをダウンロードすることができます。ただし、入手できるファイルはXBRLファイルのため、csvファイルへの変換には一手間かかります。

参考にしたウェブサイト

まとめ

  • 無料で利用可能
  • XBRLファイルをCSVファイルに変換するのが面倒

未検証の方法 or 検証中の方法

会社四季報オンライン

会社四季報オンラインでは過去の会社四季報を閲覧することができますが、テキストではなく画像での表示のためスクレイピングによってデータを取得することはできませんでした。また、会社四季報オンラインのスクリーニング機能を用いてデータを取得できるかについては未検証です。

会社四季報データベース

東洋経済新報社の発行する会社四季報のデータベース版となります。データはテキストまたはpdfとなっているため、テキストのデータを取得してcsvに変換する必要があります。こちらのデータは1社あたり100円となっており、すべての企業のデータを取得する場合には膨大な資金が必要となるため、現状私はこちらの方法を試しておりません。

紙媒体の会社四季報からOCRを利用してデータを抽出

紙媒体の会社四季報のページを1枚ずつスキャナーでスキャンし、OCR(Optical Character Recognition: 活字の文書の画像を文字コードの列に変換するソフトウェア)を利用してデジタルデータ化してcsvに変換できないかと考えましたが、紙媒体の会社四季報の厚みが薄いページを正常にスキャンできるか、スキャンしたページから正しく文字を読み取ることができるか未知数のため、こちらの方法は試しておりません。

TDnetから取得

TDnetでは決算短信(上場企業の四半期ごとの業績等が記載された書類)を適時開示情報閲覧サービスを利用して閲覧することができます。ただし、TDnetでは決算短信を過去31日分までしか閲覧することができず、ダウンロード可能なデータが少なかったためこちらのサービスを利用してのデータの収集は断念しました。

決算データ取得方法早見表

最後に各方法の長所短所を表にまとめてみました。

 簡単さ面倒臭さデータの種類の多さ過去データ決算データの期間料金
決算プロ約4年分四半期ごと無料
KABU+約2年分毎年4,950円~/3ヶ月
四季報CD-ROMをExcel化業績10期分/財務3期分約7,700円/CD1枚
EDINET約5年分無料

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です