Unbelievable Tour in Japan #2(MOTEX主催)Cylance R CEO Stuart McClure氏 講演「セキュリティ×AI」でゲームチェンジを仕掛けた理由

Unbelievable Tour in Japan #2(MOTEX主催)Keynote

「Unbelievable Tour in Japan #2」の"Keynote"は、Cylance創設者のスチュアート・マクルーア氏。

同氏は「今のセキュリティは、バックミラーだけ見て運転するようなもの。過去だけ見ていても、すぐに何かにぶつかって事故を起こしてしまうだろう」と述べる。

最近では、全ての脅威を防御することは難しいという一種の「あきらめ」の境地に立ち、検知とレスポンスにフォーカスするEndpoint Detection and Response(EDR)製品への注目も高まっている。たとえ脅威が侵入したとしても、可能な限り迅速に補足し、封じ込めなどのアクションを取ることで、脅威にさらされる時間を最小化するというアプローチだ。

だが同氏は「このモデルも、あまりうまく機能しないだろう。というのも、これもまたシグネチャベースだからだ。シグネチャに基づく限り、失敗は続くだろう・・・」と述べる。

こうした現状に対し、サイランスでは全く新しいアイディア「機械学習、マシンラーニングという新しい技術を活用することで、未知の攻撃を効果的に防御するという新しいアプローチ」を取り入れた。

なぜ我々がCylanceを始めたのか

その真の答えは、「AIの準備」ができたからです。

当時主流だった定義ファイルベースのアプローチをサイバーセキュリティから無くしていくことができないか、その上で、過去に見たことの無いサイバーアタックからの保護及び予防ができないか、というアイディアのもと2012年に会社設立しました。これまで、Fortune500の企業のうち100社以上がCylanceを採用いただいています。
現在では社員850名、グローバル顧客数6,000社以上、1000万台を超えるエンドポイントで稼働しており、販売開始3年半にも関わらず、大きく成功を成し遂げることができました。
その理由は明確です。サイバーセキュリティにおいてAIが有効だからです。

数学によって未来を予測する方法とは何なのか?

Cylanceのミッション、製品を本当に理解するためには、本質的に数学を理解する必要があります。しかし数学はときに、とっつきにくい。そのため、非常に簡易なたとえでお話をしてみようと思います。

自然の生み出すリズムやハーモニーに目を向けてみるとき、そこには何かパターンがあることに気づきます。そのパターンは、アルゴリズムであり、アルゴリズムは数学です。みなさんが起きたとき、周りを見渡す。自然を見る。あらゆるパターンは、数学的に変化しています。私は『啓示』に気づき「あらゆる自然は数学であり、アルゴリズムが見つかれば数式が見つかる。数式によって未来を予測できる」と腑に落ちたのです。

例えばこの「アイディア:ひらめき」は、オウムガイにも見られます。これは海の生物であり、5億年前から、生存のために進化を続け、他の生物を圧倒する程の長い間存在し続けてきました。その理由は、数学で説明できますが、それはなぜか?また、どのようにそうしてきたのでしょうか。オウムガイの殻の中心から始まる各部屋は、その隣り合う部屋の1.33倍(黄金比)で大きくなっています。私がこれを知ったとき、それはまさに『啓示』でした。自然は、その根本的な要素として、どのように数学を使うか、それによって生き長らえることを、知っていたのです。これをきっかけに、私たちが普段目にするその他のことで、数学を活用できるものはないだろうか。そして数学を活用して、実世界に直面する問題を解決することができるのではないだろうか。これが、Cylanceの始まりであり、私たちが挑んだ課題なのです。

自然界では様々なところに「数学」が使われていますが、唯一、サイバーセキュリティはそれをせず、代わりにシグネチャ(定義ファイル)を使ってきました。シグネチャは過去に経験したパターンですが、ここにおける問題はそれらは既に過去であるということです。新しい攻撃が行われたとき、そのシグネチャは無効です。新しい攻撃に対する新しいシグネチャは存在しない。誰も見たことがないからです。ある有名企業のCTOとして、私はこのことに非常に不満を持っており、また同時に無念の気持ちでいっぱいでした。しかし、先ほどお話したように他の方法に気づき、サイバーセキュリティにおいても「数学・アルゴリズム・機械学習」を使うことで、効果的に未来を「予測」できる。Cylanceがそれを可能にしたのです。

生贄の子羊はもういらない

さて、ここで従来のシグネチャによる手法を見て見ましょう。

私が前職である大規模な組織の長であったとき、毎日2,000人がシグネチャを作成していました。これは、あまり知られていないことですが・・・ 約7,000人の社員のうち2,000人が、可能な限り早くシグネチャ作る努力をしていました。しかしそのやり方は悪い事象が起こることをキャッチすることだったのです。

シグネチャによる手法をもう少し詳しく説明すると、まず、既知の攻撃に関するセット、そして過去の攻撃に関連のない新しい攻撃に関してのセット。そして、ここに新しい被害者(生贄の羊)があります。サンプルを取得し、サンプルによく似たサンプルをできるだけ多く取得し、人間による分析をします。
つまり、それらサンプルを見て、リバースエンジニアリングを実施し、分解して新しいシグネチャとして作成するのです。それはクラウドにあげられ、管理者はそれをパターンファイルとして更新します。願わくは、彼らがそれと全く同じ攻撃を受けてしまう前に。
しかしこの間に、攻撃ファイルが1バイトでも変わってしまえば、このシグネチャではそれを止めることはできません。
この手法は長らく、サイバーセキュリティにおける主流な手法として使われており、今日においても世の中に存在するほぼすべてのサイバーセキュリティは、その根幹がこのモデルです。

これは、自動車を運転するときに、バックミラーだけを見て運転すること、つまり過去を見て運転することと同じです。これでは衝突が絶えないのも仕方ありません。

サイバーセキュリティの進化

これらを解決するためには、過去を知ることです。過去を知ることは第1ステップであり、未来を作ることでもあります。

始まりはシグネチャ型のアンチウイルスです。その後、ヒューリスティック型(HIPS)と呼ばれる、より一般的にパターンを見るものが登場しましたが、これもまたシグネチャ型です。そして、サンドボックス(隔離)型が出現します。これは2008年代に現れ、ハードウェア・ソフトウェア両方のサンドボックスが存在します。しかし、これも攻撃を止めることはできません。
そして、EDR(検知&対策)が出てきました。これはつまり、防御は諦めるということに他なりません。もちろんそれを個人的に問い詰めるつもりはありませんが・・。

不思議なのは、これまでの技術では防ぎきれていない現状がありながら、サイバーセキュリティ企業の企業価値は上がっていることです。攻撃が発生し感染被害が増えると、それら企業価値が上がっているのです。これは何かの間違いではないか?と思いたい。

もう少し議論してみましょう。EDR技術においては、何か攻撃を予防するということはほぼ不可能だという考え方です。なぜなら攻撃を検知し、それに対して対策(レスポンス)するということのみだからです。これが使える企業は、十分な人数の優秀な人材を雇えて、彼らが的確な時間に動き、攻撃が行われているそのときを捉え、そして可能な限り早く対策につなげ、攻撃による影響を最小限にすることが可能である必要があります。

しかしこのモデルは現実的ではありません。私達は、幾度となくこれにトライしてきましたが、シグネチャ型のモデルに依存し続けている限り、私達は常に攻撃を防ぐことに失敗するのです。

私は大学で、心理学・哲学・コンピューターサイエンスを履修していましたが、実は数学は得意ではありませんでした。常にBやC(注:5段階評価の2-3程度)です。しかし統計学は好きでした。そしてコーディングも好きだでした。コンピューターをデータでトレーニングして、統計的に意味を見出すというアイディア、これがCylanceの基になっています。2012年にCylanceを始めるにあたり、大きく2つのことが私達の後押しとなりました。

サイバーセキュリティの進化

サイバーセキュリティにおけるAI 活用のレベルと進化

1つ目は、データにアクセスできたことです。AIというのは、正しいデータが無ければ何の意味もありません。
2つ目は、コンピューティング性能が向上し、大量のデータを処理し、高次のデータ領域を処理することができたことです。
クラウド技術の進歩(例えばAmazonにみられる)がなければ、Cylanceを作ることは叶わなかった。幸運にも、それが可能だったのです。今や、多くの人が「AI」や「機械学習」という言葉を耳にしていると思います。またサイバーセキュリティ業界ほぼ全てのプレイヤーが、AIや機械学習を使っていると公表しています。しかし、これらのほとんどはマーケティングの意味合いが強いものばかりです。会社を始め、数理モデルやAIを喧伝しはじめたとき、周りにそれらを語る者はいませんでした。それが今は、みんなが語っています。

Unbelievable Tour in Japan #2(MOTEX主催)Stuart McClure氏

彼らと私たちは何が違うのか。まず第1には、誰よりも長くこの技術に携わっていることです。またグローバルで最大とは言いませんが、データサイエンティストの大きな組織を有しています。先日、データサイエンスチームの採用活動について、私達はハイテク企業Top10に入るGoogleやFacebookと肩を並べるほどであるという結果が発表されました。

では、私達の技術は他とどう違うのか。ほとんど(95%)の企業は機械学習を実装しているというが、実際はシグネチャ型やパターン認識を機械 学習を使ってやっているだけです。

一方全体の5%に も満たないが、第1世代の機械学習をやっているところもあります。がしかし、非常に限られたサンプル、特徴点を使い、クラウドでのみ検知判断を行っています。また学習に長い時間が掛かり、結果誤検知や検知ミス(False Negative)の多いものとなっています。

第2世代になると、より大きなデータセットと特徴点を持ち、そして検知判断をエンドポイント上で実施します。この方法であれば、攻撃の検知は非常に容易であり、検知のためにクラウドに接続する必要もありません。しかし今日において、他の誰もこの方法を取っていません。

最後に第3世代のAI。私たちはこの領域に達しています。ここでは第2世代よりも巨大な数理モデルがあり、それらモデルにて強靭な防御が可能になっています。しかし、私達はここでは終わりません。私たちは その先の第4世代、第5世代に至る道を見ています。

大きなブレークスルーはちょうどここであると考えています。つまり、「何故それが起こったか」を表現できるようになる、ということです。AIにおいて「なぜ」を導き出すのは最も難しいことです。実際このことは、なぜ人々がAIに不安を覚えるかということを考えると容易です。つまり彼らは「なぜ」が説明できないからなのです。なぜこの攻撃を捉えたのか。なぜこれ を「悪意あるもの」と決定するのか。 最大の課題は、「これは良い・悪い」は判断できるが、「なぜ」は語れないのです。この市場にいる誰も、現時点でその領域には至っておらず、これはサイバーセキュリティ市場だけでなく、AIを使ういかなるプレイヤーを含めてもです。

AIのサイバーセキュリティ活用におけるレベル 2

しかし、私達は第4世代に到達する道を捉えていると自負しているのです。これまで発生したすべての攻撃を見ていくと、主に3つのパターンに分けられます。
1つ目は実行ファイルベースの攻撃。つまりウィルスやトロイの木馬、ランサムウェアやワームなどです。
2つ目はアイデンティティベースの攻撃。これらは、あなたのIDを利用するもので、例えば安易なパスワードや、紙に残して見えるようにしていたり、傍受されるなどして盗まれることで、そのIDを使って攻撃するというものでです。
3つ目は、DoS攻撃。これらは、正常な通信を膨大な量送りつけることで攻撃し、コンピューターやサービスをダウンさせてしまいます。

これら3つは、サイバーセキュリティ業界において非常によく知られている用語に紐付けすることができます。それは、「機密性」「完全性」「可用性」です。攻撃者の周りにこれらの関連があることはよく知られています。

皆さまもこれらに該当する多くの事例を知っていると思います。
例えば、WannaCry、Petyaなどのランサムウェア、Equifax;ウェブ攻撃、Deloitte、OneLogin、Yahoo;IDベースの攻撃を受けたなど。また、内部脅威;内部の人間として文書を盗み、他に渡す。NSAがハッキングされ(シャドーブローカーによって)、CIAもハッキングされた(Vault7によって)。これらはIDベースの攻撃です。

私達は、アイデンティティベースの領域に踏み込んでいきます。それは、数理モデルの「あなた」というアイデンティティを作れると考えているからに他なりません。そしてコンピューターにこのモデルを配信するのです。また同時に、攻撃への防御はどこであっても必要であるということを知っています。

CylancePROTECT R Home Edition

CylancePROTECT R Home Editionイメージ画像

私達は今年、コンシューマ向けのHome Editionをリリースしました。
Home Editionでは、スマートかつシンプルなセキュリティを実現します。

こちらがその概要です。

CylancePROTECT® Home Edition の概要

AIを駆使し、将来現れる未知のマルウェアの亜種を予測してブロックすることで、既存のどの消費者向けアンチウイルスソリューションよりも優れた保護を提供する、1初の消費者向け次世代セキュリティ製品です。

家庭内で技術的な作業を担当するメンバーが、家庭環境にあるあらゆるデバイスのセキュリティの状態を確認し、把握できるように支援

従業員の家族全体をセキュリティで保護。また、遠隔地にいる家族(高齢の両親、大学生の子どもなど)のデバイスの安全性とセキュリティを確保し、保護

■従来の消費者向けセキュリティ製品に関連する肥大化、システムの低速化、ノイズ、数多くのポップアップによるシステムの停止を回避

容易なインストール、容易な管理と構成、自動更新、消費者向けデバイスの自動的な保護によって、「一度設定するだけで管理不要」のセキュリティエクスペリエンスを提供

現在の企業版モデルを非常に簡易に落とし込み、ユーザーにはほとんど影響を与えることはありません(ほとんど見えません)。実際には企業版でもユーザーにはほとんど見えないのですが。
これにより、自宅で使うときも非常に簡単に使え、かつ簡単に管理できるようにしています。日本は2018年にリリースを予定していますので、ぜひご期待ください。

今後の展望

このように未来を見ていくなかで、私はこのメッセージを日本の皆さんにお送りしたいと思います。

「AIやそれによる機械学習やディープラーニング、数学を、恐れないでください。それらを受け入れ、理解し、人が介在する判断について問いかけ、知識化し、組織に存在するパターンを適応させてください。パターンを発見したとき、脳がそれを認識することで、これにより機械学習がより良くなるのです。組織がAIを活用するようになれば、さらに容易に、未来への道が切り開けると確信しています。そうすれば困難な状況にはならないでしょう。私達は、サイバーセキュリティの歴史の中で、悪意ある攻撃者の先を行った最初の例です。今日、私達は99.9%の確率でいかなる攻撃も捉えることができます。私達を信じる必要はありませんが、自分自身でテストし、トライしてみてください。AIによって、仕事を取られてしまうという懸念が流布しているが、私は、それが真実になることは全く無いと思います。それは何故か。それは現在の領域の半分がAIによって補われたとしても、依然取り組まなければならない領域はたくさんあり、むしろそれらは今までは取り組めてなかったということです。この領域に人を集中させることができるようになることは素晴らしいことなのです。最後に、(暗に)誰も信用しないでください。自分自身を信用し、テストし、どのような分野であってもAIを活用していって欲しいと思います。」

ありがとうございました。

※本記事は2017年11月30日に開催された「Unbelievable Tour in Japan #2」(MOTEX主催)
トークセッションでのStuart McClure氏の講演全文を日本語訳したものです。