古いバージョンのブラウザーを使用しています。MSN を最適にご利用いただくために、サポートされているバージョンをご使用ください。

ビッグデータで株式投資はどう変わる? カブドットコムの先進事例

ITmedia エンタープライズ のロゴ ITmedia エンタープライズ 2017/01/19
ビッグデータで株式投資はどう変わる? カブドットコムの先進事例: カブドットコム証券 取締役 代表執行役社長 齋藤正勝氏 © ITmedia エンタープライズ 提供 カブドットコム証券 取締役 代表執行役社長 齋藤正勝氏

 「Fintech」という言葉に代表されるように、昨今、金融業界でのビッグデータ活用に注目が集まっている。データ分析で未来を予測し、次の一手をどう打つか……三菱UFJフィナンシャル・グループのネット証券、カブドットコム証券もそのような取り組みを行っている企業の1つだ。

 社長が自らデータに触れ、データの分析や活用を進める同社だが、どのような課題を感じ、どのようなシステムを構築しているのか。日本データマネジメント・コンソーシアム(JDMC)のユーザー会で、同社代表執行役社長の齋藤正勝氏が講演を行った。本記事ではその講演の様子をお届けしよう。

●カブドットコムはデータ活用にどう取り組んでいる?

 カブドットコム証券がビッグデータのプロジェクトを始めたのは約2年前。システム部門やマーケティング部門のミッションとしたり、データサイエンティストを育成したりといった本格的なものではなく、「データサイエンティスト的な人を無理やり社内から集めて始めた」(齋藤氏)ものだったという。それぞれの部署が業務の課題を抱えていたこともあり、プロジェクトは動き出したそうだ。

 同社では、主に“予測”のためにデータ分析を行っているという。株式を取り扱っているため、明日の株価や米国大統領選の結果によって、金融商品はどのような影響を受けるか、という予想が業務に大きく影響するからだ。「当社はかっこよく言えば予測産業のようなものです。終わったことを振り返ることも重要ですが、予想することが文化として根付いているところは弊社の特長ですね」(齋藤氏)

 システム面も一般的な企業や銀行とは、異なる傾向があるという。「秒間2000トランザクション、そして同時セッション数も10万近くまで増える日がある」と齋藤氏は話す。マーケットが開く午前9時などのイベントに合わせて瞬間的にアクセスが伸びる一方で、アクセスが非常に少ない時間帯もあるそうだ。

 「当社では、ミリセック(1000分の1秒)やナノセック(10億分の1秒)という言葉が飛び交っています。1秒でも遅れたりダウンしたりすると、もう情報の価値がなくなってしまうビジネスなのです。実際に当社では、注文の執行が1秒以上遅れたら手数料を無料にするサービスもやっており、非常にシビアなシステムにしています」(齋藤氏)

 もちろん、ヤフーなどの検索サイトでも株価を見ることができるが、投資家向けのカブドットコムの場合、高いリアルタイム性が求められる。

 分析に使うデータはアクセスログが多いが、ほとんどは外部のマーケットデータを使うそうだ。中でも最もよく使うデータは、現在の注文数などの状況を示す「板情報」で、株の約定を時系列で表示する「歩み値」を獲得して計算し、1秒後の株価を予想しているという。

 同社がユニークなのは、口座数や受注件数をはじめ、システムの稼働状況までも企業情報として開示している点だ。これは、齋藤氏自身がデータを扱えることで生まれたポリシーだ。

 「こうした情報は法的には開示する必要がないものです。各社員には、『社長の自分がデータを扱えるのだから、皆で開示するデータを分析してまとめなさい』と伝えています。情報開示は一度行うと基本的にやめることができないものですが、各種情報を慎重に扱うことにもつながるため、いい企業文化だと思っています」(齋藤氏)

●カブドットコムのデータ活用、7つの課題

 ビジネスにデータ分析を生かす取り組みを続ける同社だが、まだまだ道半ばとのことで、データ活用における課題として、齋藤氏は以下の7つを挙げた。

1. データを管理する部門(システム部)とデータを必要とする部門(マーケティング部・リスク管理等)の分断による非効率化

2. 膨大な取引データ、ログデータ、属性データは蓄積しているだけで活用できていない

3. 各部門で積極的にKPIを開示する志向はあるものの、それらを横断的にひもづける横断的な視点の不在

4. ユーザー部門にとって、簡単にアクセスできるDWH環境がない

5. バッチ処理で1日1回の更新するデータもあり、市況に合わせたリアルタイム性が確保できていない。データ量や複雑性が増大しており、求められる検索速度に至らない

6. 分析者の試行錯誤やイマジネーション、都度のPDCAに耐え得る検索速度の確保

7. ユーザー部門がデータソース設計に携わることがなく、リテラシーが向上していない。そのため要件ごとにシステム部に依頼し、データを抽出する体制になってしまい、対応コストが増大している

 特に齋藤氏が課題に感じているのが、「ユーザー部門にとってアクセスが容易なDWH環境がない」ことと「バッチ的な処理もまだあるため、リアルタイム性に欠ける」ことだという。

 「中には、SQLを自分で書いてデータをまとめられるメンバーもいますが、全てのユーザー部門にとってDWHが容易に扱えるかというとそうでもありません。そして、リアルタイム性が低くなるということは、データの価値が下がるということ。それが、当社の価値を下げてしまうことにもなりかねないので、リアルタイム性をどんどん追求していくようにしています」(齋藤氏)

 そこで同社は2016年、プロジェクトチームを組成してDWH/BI基盤の導入を進め、「HPE Vertica」や「Tableau」を導入している。その結果、大規模データ処理の速度は向上し、BIツールも使いやすくなったという。特にBIツールについては、いくつかの製品で、実際の業務(顧客)データを使った(Proof of Concept=概念実証)を実施して検討した。

 Tableauについては、本格的に活用するとなると社員のトレーニングが重要だが、ベンダーによるトレーニングだけではなく、他にも多くのトレーニングプログラムがあるため、より多くの社員が使えるようにコストと内容を考えて、オンライン学習なども併用するのがオススメだと齋藤氏は話す。

 「Tableauは全部門で使っていますが、もちろん全員が使っているわけではありません。約120人の社員に対して10%弱のメンバーがヘビーユーザーで、30人ぐらいが普通に使っている状況です」(齋藤氏)

●データ解析の結果をAPIとして開放、他サービスとの連携に注力

 同社ではデータ解析の結果を、社内だけではなく顧客への価値提供にも応用している。例えば、資産管理のシミュレーションアプリ「FUND ME」では、口座別投信残高、リスクメジャー、顧客属性データを「匿名化」によって、デモグラフィックデータとして利活用したり、1分足ベースで400万件/日・配信気配本数ベースで4000万件の取引所データを使って、各銘柄の近未来の予想売買高を計算し、ランキング化して株価のリアルタイム予測もしているという。

 また、画像認識技術を使って株価のチャートを画像として認識させ、人工知能による類似チャート銘柄を検出する取り組みも行うなど、先進的な技術を次々とビジネスに取り込んでいる。

 特に最近では、同社のサービスをAPI化(kabu.com API)して、データを提供したり、他サービスと連携したりする取り組みにも注力している。特にTableauとの連携については、他社に先駆けていち早くプロジェクトを進めたそうだ。

 「Kabu.com APIとTableauを連携させるにはまず、TableauのWebデータコネクタでkabu.com APIにアクセスします。次にTableau連携サーバからJSON記述で出力し、Tableauクライアント上に表形式で可視化。最後に4本値データなど、豊富なkabu.comから提供されるデータをTableau上で描画して分析に生かすのです」(齋藤氏)

 このように、Tableauのパワーユーザーやトレーダーなどの顧客が、kabu.comから提供されるデータを使えば、自分の株取引に生かせるようになる。そして、ただAPIを提供するだけでなく、Tableau社と交渉してTableauの1つのメニューとして組み込んだことは金融業としては非常に珍しく、先進的な取り組みといえるだろう。

ITmedia エンタープライズの関連記事

image beaconimage beaconimage beacon