古いバージョンのブラウザーを使用しています。MSN を最適にご利用いただくために、サポートされているバージョンをご使用ください。

プライバシー保護のせいで、日本の人工知能活用が遅れている?

ITmedia エンタープライズ のロゴ ITmedia エンタープライズ 2017/09/21 08:00
プライバシー保護のせいで、日本の人工知能活用が遅れている?: 人工知能ブームが起きている今、ビジネスの世界では“データの奪い合い”が起きています(写真はイメージです) © ITmedia エンタープライズ 提供 人工知能ブームが起きている今、ビジネスの世界では“データの奪い合い”が起きています(写真はイメージです)

 人工知能(機械学習)ブームが起きている今、ビジネスの世界では“データの奪い合い“が始まっています。製造業、小売業など、あらゆる産業の現場だけでなく、日々の生活の中にも、データを計測するIoTデバイスが登場して、私たちの日常からあふれるデータを計測しているのです。

 連載の第5回で紹介したように、機械学習は今手元にあるデータを基に判断を行います。その点で、そのデータによって人工知能の価値が決まると言っても過言ではありません。

●これからの企業間競争は「データ」が全て

 機械学習を使ったシステムを成功させるポイントは、膨大でさまざまな種類のデータを、安い基盤に蓄積して、いかに素早く学習し、結果を得るかだと私は考えます。つまり、データ、基盤、アルゴリズムの3つが重要であり、競争優位性を持つ要素なのです。

 しかし、ここ数年の「クラウドの進化」や「GPUによる学習」というイノベーションのおかげで、多少のお金があれば、誰でも基盤を購入できるようになりました。今では、この要素で他社と差をつけるのは難しいでしょう。

 またアルゴリズムについても、AGFA(Apple、Google、Facebook、Amazon)と呼ばれる4強やMicrosoftやBaiduといった大企業がディープラーニングに関するオープンソースを提供しています。それらを使えば、誰でも気軽に人工知能を開発できるようになったことから、これも他社と差別化がしづらくなっています。

 つまり、最後に残ったデータだけが、他社との差別化要因として存在し続けているのです。他社では得られないデータを、いかにして自社で計測するか? そのデータにこそ、貴重な価値があります。他社にないデータを含めて学習することで、より精度の高いアウトプットが期待できるならば、データはまさに「21世紀の石油」といえるわけです。

●個人情報保護法がデータ活用の「足かせ」になるという誤解

 今、ビジネスに最も重要なデータとして注目を集めるのが「ライフログ(Web内外の個人の活動記録)」です。現在、AGFAがこぞってスマートスピーカーを開発していますが、個人の住居に設置し、横断的にライフログを計測できるシステムと考えれば、その理由もうなずけます。

 しかし、ここで気になるのはプライバシーの問題です。日本では、2017年5月に「改正個人情報保護法」が施行されました。この法律は、いわゆる“ビッグデータ時代”に対応した法改正として多くの注目を集めた一方で、ビジネスに悪影響を与えるという見方をする人もいます。このままでは、日本は人工知能関連の開発で世界に負けてしまうのでしょうか。

 個人に関する情報であるライフログは、特定の個人を識別できる情報とセットで保有されれば「個人情報」に該当します。例えば、スマートスピーカーが位置情報とともに家の電力メーター情報を取得していた場合、位置情報から個人が特定できるならば、電力メーター情報も個人情報になるわけです。

 関西経済同友会が2017年8月に、発表した「Well-Being新産業創造と世界最高水準の『日本型IR』に向けた夢洲まちづくりへの提言」では、ライフログに関する制度や市場が整備中であるため、夢洲を個人情報管理の規制緩和をした特区にしたい、と求めています。つまり、現行の個人情報保護法は産業を生み出すのに足かせになると言っているのです。

 彼らが提言しているライフログの定義を見ると、医療データまで含んでいることが分かります。取り扱いに気を付けるデータの規制緩和となると、影響が大きい話であるように思うのですが、リンク先の資料を読んでも、現行法の何が問題で、どんな規制緩和をして欲しいのか、条文を明記して「こう変えて欲しい」と提案しているわけではありません。これでは議論にならず、いたずらに時間が過ぎるだけでしょう。

 中には、「どうすべきか?」という代替案の代わりに「米国に負ける」「競争に負ける」という抽象論を振りかざす人がいるので、議論がかみ合わないこともあります。

 その代表例が「日本の著作権法は厳しい。だから日本からGoogleが登場しなかったし、Googleに負けた」という大きな間違いです。私はWindows 95時代からインターネットを利用していましたが、「あのとき使ったgooやフレッシュアイは日本生まれではないか?」と疑問に思いました。

 Googleが最後発ながら、あっという間に市場を席巻したのは、圧倒的な精度の良さや、当時としては公平性が高かった「ページランク」というWebページの評価指標、増え続けるWebページをクロールするインフラ、これらの資金をまかなう検索連動広告があったから。いわば技術力と資本力で負けたのです。著作権法は何の関係もありません。

 こうした法律の目的は、あくまで消費者の権利を守ることです。確かに実証実験のしやすさなどといった面で、法律が“足かせ”になるケースもあります。しかし、法律やプライバシーの問題をクリアしないことには、万人に受け入れられるサービスにもなり得ません。私には個人情報保護法を、人工知能関連のサービスを作れない言い訳にしているように聞こえてしまうのです。

●人工知能には「ビッグデータ」が必要なのか

 もう一つ、人工知能に必要なデータにまつわる大きな間違いとして、「人工知能にはビッグデータが必要」というものがあります。4、5年前にビッグデータという言葉が注目を集めて以降、データ活用においてはVolume(量)、Velocity(頻度)、Variety(種類)、これら3つのVが大切だと、さまざまな人が訴えていました。

 今となっては「量ばかり追いかけてもダメ」「高頻度で発生するなら多少は欠落してもよさそう」「最初は種類が大事だけど、ずっとあらゆる種類のデータが必要なわけではない」といった、地に足の付いた議論がなされるようになってきたと思います。

 まず数年かけて分かったこととして、精度が低いデータ(計測ごとに値が変化するデータなど)は、どれだけ集めても“ゴミ”に変わりなかったという事実です。「量が多ければ相関関係が見えるかもしれない!」という主張もありましたが、本当に相関があるなら量が少なくても相関は表れるし、精度が悪ければそもそもそのデータが信用に足るかが分かりません。

 データの量を求めるか、質を追求するか――。これは二律背反の話ではなく、担保しないといけない質を定義してから、量を求めていくという条件の定義です。量さえあれば質は関係ないという話ではありません。「機械学習で精度の悪さを補正できる」という意見もありますが、全てを賄えるわけではありませんし、非効率的でしょう。

 データの種類(多様性)についても疑問が残ります。種類が豊富であることに越したことはないですが、何でもかんでも分析に使えばいいというわけではありません。その代表例が「ディープラーニング」です。

 ディープラーニングは計算で出た値に対して、その原因を論理的に説明しづらいため、ビジネスの現場で使いにくい面があります。私は以前、とあるデータコンペで、列車到着の遅延予測モデルを作成するプレゼンに参加したことがあります。上位になったモデルの中に「理由は不明だが、北関東の天候が都心の遅延予測に有効」という内容のものがありました。

 この発表のとき、会場がとても微妙な雰囲気になったのを覚えています。確かにそうだったとしても、論理的な理由がないロジックに判断を任せられるのか。失敗をしたときに誰が責任を取ればいいのでしょうか。さまざまな種類のデータを取れば、分析は何とかなる、という話ではないのです。

 論理的説明ができる範囲に限ってデータを計測すべきケースも多いですし、論理性を求めるレベルによっては、そもそもディープラーニングを使わない方がよいこともあるでしょう。あるいは、対象とする特徴量を事前に選定するという作業は、結局人間がやることになるのかもしれません。

 確かに人工知能に良質なデータが必要なのは事実ですが、必ずしも“ビッグ”である必要も、多様である必要もないということです。「あればそりゃ精度は上がりますけど、どうなんでしょう……」という反応を示すエンジニアは多いのではないでしょうか。

 「人工知能にはビッグデータが必要なのに、個人情報保護法が邪魔をしている!」と声高に主張されている人の多くは、コンサルタントや経営者であるように思います。実際に現場で実装している人間が、そうした活動をどれだけ冷ややかな目で見ているか、一度後ろを振り返るのも良いかもしれません。

●著者プロフィール:松本健太郎

株式会社ロックオン開発部エンジニア 兼任 マーケティングメトリックス研究所所長。

セイバーメトリクスなどのスポーツ分析は評判が高く、NHKに出演した経験もある。他にも政治、経済、文化などさまざまなデータをデジタル化し、分析・予測することを得意とする。

本業はデジタルマーケティングと人工知能を交差させて、マーケティングロボットを現場で運用すること。

ITmedia エンタープライズの関連記事

image beaconimage beaconimage beacon