EXCELでDIY |
Excelで競馬分析をしよう | |||
Home > DIYしよう!> ExcelでDIY |
お知らせ | ソフトウェア | 競馬研究 | DIYしよう | 出馬表 | 開催情報 | BLOG | リンク | モバイル |
■JRA-VANデータの読み込み方法 その1Excelは非常に便利な分析ツールですが、分析をするにしても元になるデータが必要になります。特に、競馬の場合、毎週データが更新される上、情報量も膨大でとても手で入力する気にはなれません。そこで、誰もが思いつくのは、JRA-VANのデータを取り込めないかと言うことです。しかし、どこから手をつければよいのか、見当もつかない人がほとんどでしょう。そこで、今回からJRA-VANデータを取り込むためのコツを数回に分けて紹介します。注)この記事は、2003年1月の情報を元に、JRA-VAN第3期フォーマットの解説をしています。 ■手順細かな方法論を説明する前に、大まかな概要について触れておきます。
ExcelにJRA-VANデータを取り込むこと自体は簡単です。VBで処理される文字コード(Unicode)をきちんと理解していれば。あとは仕様書を見ながらめげずにコードを記述するという力作業になります。故に最も必要なのは、 4.根性 なのです。初めにお断りしておきますが、かなりの精神力を要求することだけは覚悟しておいてください(笑)。 ■JRA-VANデータの仕様取り込むデータがどういう形式の物なのかを理解しなくては、始まりません。試しにお手持ちのJRA-VANデータを解凍してみてください。成績表を例に取ると次の2つのファイルが現れます。 JracDen1.dat 拡張子はDATですが、中身はテキストファイルなので、メモ帳や秀丸エディタ、EmEditorなどのエディタソフトで読み込めます。ただし、中身はただの数字の羅列で、何が書いてあるのかさっぱり分からないと思います。それはそうです。コンピュータで読みとることを前提に制定されているので、扱いやすく、データサイズをコンパクトにするためにJRA-VANで定めたコードに基づき表記されているからです。だから、JRA-VANデータを読むには、このコードが分からなければ何も出来ないでしょう。 そこで、まずJRA-VANの仕様書をダウンロードする必要があります。 ■JRA-VANデータの種別仕様書にざっと目を通してもらえば分かりますが、JRA-VANデータには以下のデータが含まれています(大まかなデータ)。
他にも特別登録や時系列オッズ、騎手、調教師データがありますが、競馬新聞を作成する場合上記データを押さえておけば取りあえず作れる様になります。 ■出馬表を読み込んでみよう先程述べたとおり、JRA-VANデータはテキストファイルです。これを読み込んで、分解して意味のあるデータに分類すれば完了です。VBAで外部ファイルを読み込む場合、OPENステートメントとINPUTステートメントを利用します。 List1.JRA-VAN出馬表読み込み
と記述すれば、解凍された出馬表ファイル(JracDen1.dat)を開き、最初の1行だけ取得して終了します。1行ずつステップ実行してみれば、動作が分かるでしょう。 では、先ほどのサンプルプログラムに読み込んだデータから日付と開催場を読みとる処理を追加してみましょう。 List2.JRA-VAN出馬表読み込み(開催日の取得)
要は仕様書とにらめっこして、必要なデータがかかれている桁数と文字数を指定すればいいのです。でも、ここで1つ問題があります。レース名や馬名など、全角で書かれた文字を読み込むと、以後の文字列がずれてしまうのです。JRA-VANデータを処理するコツは、この桁ずれをどう処理するかにかかっています。
次回は全角文字の含まれたデータを難なく読みとるテクニックを紹介します。 |
||||||