目次
――ご紹介――
株式会社ジール
マルチクラウドデータPF _第三部
コンサルタント
Nさん
Nさんは株式会社ジールに新卒入社後、様々な案件を通じてSASの業務をこれまで多く経験されてこられました。
そんな2022年のある日、当時の上司から「SASハッカソンに参加してみないか?」と打診を受けます。Nさんは実業務とハッカソンという2足の草鞋で9か月ハッカソンに取り組み、アジアエリアの出場者としてジールの名を高く知らしめました。
SASハッカソンについて
SASハッカソンとは、SASのプラットフォームを用いて、ビジネスの現場で発生する課題を解決するためのアイデアを競うイベントです。世界中のデータ分析初心者から専門家までソリューションの開発に取り組む方からのアイデアをコンテストする大会です。
SASハッカソンの募集内容
SASでは大きな課題に取り組むアイデアを求めており、開発者や学生、スタートアップ企業、SASの顧客やパートナーなど、ビッグデータの専門家から初心者まで、
市場に投入、あるいは自身が所属する組織内で展開可能なソリューションの開発に取り組む人たちを募集します。2022年には世界75カ国から1,300人の応募があり、
135の組織を代表する70チームが参加資格を得て、50以上のチームがビジネスケースを提出しました。
▼参考
引用:SAS社「SAS、『SASハッカソン2023』への参加登録を開始、アナリティクスに関心を持つすべての人が集結」
SASハッカソンに参加することになった背景
―SASハッカソンについて教えてください。
Nさん:ハッカソンという言葉を聞くと、プログラミング競技会、プログラミングの精度を競う競技というイメージがしますが、SASハッカソンは全くそういうイベントではなく、世の中の自分たちが解決したい課題を一つ挙げて、それを解決するためにデータとSAS製品を活用しようという趣旨で「人々がデータから容易に洞察を獲得できるようにすることで、進歩をもたらす大胆で新しい発見を促す」という目的を体現するのが目的の場です。
―SASハッカソンに参加することになったきっかけを教えてください。
Nさん:2021年に当時の上長に出場してみないかと声をかけられました。
しかし募集要項を確認すると、エントリーをする時点である程度計画を練る必要があるということが判明し、準備不足によりその年は見送りました。
本格始動としては、2022年の8月ぐらいから動き出しました。
―メンバーはどう集めたのですか?
Nさん:声をかけられた時点では誰も決まっておりませんでした。一緒に話を受けた同じマルチクラウドデータPF部署の上長と私だったのですが、この取り組みについての方向性はゼロという状態でしたので、まずは人を集める必要があるなと思いました。
2022年の8月頃、部門全体に向けてSASハッカソン出場を考えているという旨を伝えてメンバーを募集しました。
そこで手をあげてくれた社内メンバー6人とでハッカソンに出場できることになりました。
―メンバーのみなさんはSASの経験者でしたか?
Nさん:いいえ。SAS経験者は私と上長のみだったので不安がありました。またSAS Viyaに関しては、私自身も全く触ったことがなかったのでほぼ素人に近かったです。
テーマ選定の背景
―ジールチームは今回、「日本経済の分析と予測 オープンデータを用いたCOVID-19前後の日本の分析と将来予測」というテーマで参加されましたが、なぜこのテーマにされたのですか?
Nさん:実は初めはこのテーマではなかったのです。当初はいろんな方からアイデアをいただく中、多数決で決定したのは「フードロスをなくしたい」というテーマでした。
そこで初めのうちは「日本のフードロスに関するデータ」を探して漠然とした分析イメージで進めていたのですが、実際のデータ入手段階で壁にぶつかってしまって…
その後、思い切って方向転換をして新たに選んだのが、このコロナ禍の外食産業というテーマだったんです。
当時このテーマは大きな社会問題になっていましたし、自社システムのCO-ODEからオープンデータの抽出が行える環境があったことも幸いして、このテーマに決まりました。
―取り組む中で苦労したことは何ですか?
Nさん:テーマ選定にだいぶ時間を割いてしまったのですが、いざ蓋を開けてみると、肝心の「使えるデータ」が思いのほかなく、苦労しましたね。
フードロスとひとくちに言ってもフードロスに係るデータの定義が確立しているわけでもなく、日本の統計局が出している公的データを見ても、どこまで見たらフードロスに繋がるのか特定できてないため決めかねてしまう状況に陥りました。
「フードロスデータ」と検索してヒットしたデータもありましたが、せっかく見つけたデータも有料だったりして、購入しても中身が使えるデータである保証はなかったので断念したりと、テーマを変えざるを得なくなってしまいました。
そんなことをしていたらあっという間に時間が過ぎて11月・12月になってしまい、結局、テーマは決まったもののデータが見つからず3ヶ月経っていました。それが一番苦戦したことですね。
―3か月間フードロスをテーマに進めた結果、振り出しに戻ってしまったわけですが、その後どうされたのですか?
Nさん:そうですね、もう本当に「どうしよう、データがない、今あるデータから何らかのテーマを選定しなければならない。」と非常に焦っていました。
―そんな紆余曲折があったのですね…。
では3か月間フードロスに関して討議した結果、データを揃えられないという理由からもう一度振り出して戻ったわけですが、その後どうやってこのピンチを克服したのですか?
Nさん:そんなとき、当時の上長から「CO-ODEのデータを使ってみたらどうか」という話をいただきました。
CO-ODEは自社の製品ですし、もしかしたらSASハッカソンのテーマに取り入れることでCO-ODEもアピールするチャンスになるかもしれないと考え、早速データを頂くようにお願いしました。
ただ、オープンデータは膨大なデータがありますので、すべてのデータを取得すると取捨選択に時間がかかると判断し、ある程度テーマを固めてからデータを取得することにしました。
その時点では、日本経済という経済動向をテーマの主軸にしようと決めていました。経済といっても様々な分野があるので、ひとつに絞る必要があります。
特にコロナ前とコロナ後の外食産業の落ち込みは社会問題にもなりましたからこのテーマで取得するデータを絞り込み、CO-ODEに格納されている過去五年~十年のデータを取れるだけ取得しました。
「コロナがもしなかったら、日本の外食産業の売り上げはどう成長していたのか?」という仮説を元に、「コロナが発生した世界」と「コロナが発生しなかった世界」の両者のデータを作成し、比較を行ったのです。
SAS Viyaにより自動生成されるモデル
予測モデルでは、「コロナ渦の日本の外食産業の売り上げ予測(赤い点線、後述)」を明らかにしたいわけです。
コロナがなかった世界の業績は、コロナが発生する前の2019年12月31日以前の業績データから2024年以降の推測ができると仮定します。
このデータを学習元にすれば、コロナが発生しなかった場合の経済予測(図1:青線)ができるはずなので、2020年1月以降のデータを入手すればよいということが分かってきました。早速CO-ODEから外食産業のデータをcsvファイルで抽出し、SAS Viyaへデータをインポートしました。
こちらはSAS Viyaの予測モデルのグラフになります。(図2) POST-COVID MODELは実際の売り上げの数値で、水色に塗られている部分が予測値になります。
▼参考
SAS. ZEAL – Analysis and Projections of the Japanese Economy
こちらは予測モデルを発表資料にまとめたグラフになります。
▼参考
SAS. ZEAL – Analysis and Projections of the Japanese Economy
食品外食産業の経済は、右肩上がりに伸びていましたが、実際コロナが発生してなかったらもっと上がっていた可能性があります。
図1は、現在の数値から2024年の外食産業の業績を未来予測しています。
・水色の実線…コロナ前の日本の外食産業の実際の売り上げ
・水色の点線…コロナがなかった場合の日本の外食産業のSAS Viyaによる売り上げ予測
・赤色の実線…コロナ渦の日本の外食産業の実際の売り上げ
・赤色の点線…コロナ渦の日本の外食産業のSAS Viyaによる売り上げ予測
点線は、SAS Viyaのコビットモデルによる未来予測※になります。
※SAS Viya のモデル予測についてはこちらの記事も参照ください。
使ってみましたシリーズ 第7弾 【SAS Viya】で需要予測編を受講してみた
今回求めたい予測は、青い点線から赤い点線の差分を引けばよいわけです。この論理をもとにこの差がどう開いていくかを分析しました。
着目したのは、急激に落ち込んだ2019年の12月30日から2022年の1月の期間です。
実際に使用したのはCO-ODEの外食産業のデータです。CO-ODEから外食産業のデータをcsvファイルで抽出し、SAS Viyaへインポートしました。
SAS Viyaのモデル作成時にテンプレートを自動予測にすると自動予測のパイプラインが作成され、モデルスコアの精度が高く一番良いモデルを提示してくれます。
―なるほど、これで今後もしコロナのようなパンデミックが起こる兆候があったら、傾向や対策がとれるかもしれないデータが出来上がった、ということですね。
Nさん:正直なところ、今回はとにかくプレゼン資料を出すことをゴールにしていました。初出場であることと、英語での資料の提出が求められているので、成果物を出すことで精一杯でした。1位を取ることは考えていませんでしたね。
一時はテーマが白紙になって振り出しに戻ってしまいこの先一体どうなってしまうのかと心配でしたが、なんとか成果物を出せたので、みんなで力合わせてやり抜くことができてよかったです。
―SASハッカソンは英語がコミュニケーションのベースとなっていますが、
提出した英語の資料や動画は、Nさん主導でメンバーの皆さんと作り上げていかれたのですか。
Nさん:そうですね。SASハッカソンはプレゼン動画の提出が成果物となります。設定した課題に対して発見したことを動画と資料でまとめなければいけません。
我々はこれだけ注目度の高い課題を発見し解決した、すごいデータを分析した、というように審査員の興味を引き、インパクトを与えられる伝え方を工夫しました。
写真ツールを使って作業する担当、シナリオ担当、動画制作の担当、総仕上げ担当など、みんなで協力しながら役割分担をして進めてきました。
具体的には、資料を作成する担当、動画のシナリオを作成する担当、動画編集担当、とりまとめ担当など役割分担をして、みんなで協力しながら総力戦で作り上げ提出することができました。
英語の部分はAIの翻訳ツールも頼りながら作っていったので、私の英語チェックは最終段階での見直しだけで済みました。
多忙の中、実業務とハッカソンの両立でつかんだ成長
―今回活用したSAS Viyaについての魅力は何だと思いますか?気に入っている機能があれば教えてください
Nさん:SAS は統計に特化している企業であり、SAS Viyaの製品は、分析したいビジョンをイメージしながら触ると、予測モデルをオススメしてくれるので機械学習の初心者にもわかりやすいと思います。いちからプログラミングをする必要もなく、ある程度ツール側で自動生成してくれるのもありがたいですね。統計や分析の初心者の方こそ触れて欲しいツールだと思います。
今回SASハッカソンを経験して、分析や統計をもっと学ぶ必要性を痛感して「SAS® Certified Statistical Business Analyst Using SAS®9: Regression and Modeling」
を受験しました。全て英語での試験だったのですが何とか合格できました。日本語に翻訳すると統計検定準一級ぐらいの高いレベル試験でしたね。こんな風に分析や統計に関するレベルの高い世界がある一方、SAS Viyaは感覚的に分析の理解ができるツールでした。もしかするとアナリティクス試験もSAS Viyaを触って勉強した方がよかったのかなと思ったほど、ユーザーに寄り添ってくれるツールでした。
―SAS Viyaはレベルが高い分析・統計ツールであるのに初心者にも寄り添ってくれるツールであるということがよくわかりました!Nさんから見て、SAS Viyaが普及することでどんな良い未来が待っていそうだと思いますか?
Nさん:最近はAI、ChatGPT、生成AIがバズワードになっており、人々の関心が高まっています。よく Pythonを勉強しようと言われますが、わたしはSAS Viyaこそ将来性があると感じます。たとえば昨今流行しているAIとも連携できる機能も充実していますので、今後SAS Viyaへのニーズはより拡大していくと思います。
―SAS ViyaはSASが中小企業向けにリリースしたサービスと言われていますが、具体的にどんなお客様の課題・問題解決にお勧めできそうな製品だと思われますか?
Nさん:SAS Viya はAIやIoTの探知などの機能にも優れているので、製造業などでは、異常値の発見、画像認識機能においての欠陥品の発見、その他クレジットカードの不正使用の発見などが行えます。
さらに、過去のデータを振り返るのも大事です。私たちの仕事のデータを元に次のアクションを予測する未来予測機能も可能ですのであらゆる業態・業種と相性がいいと思いますね。
今回活用したCO-ODEについて
補足:CO-ODEとは、オープンデータや外部データを収集・加工して配信しているサービスです。
https://www.zdh.co.jp/products-services/external-data/co-ode/
―今回参加されたSASハッカソンでCO-ODEデータを活用されていましたが、CO-ODEの使いやすさはいかがでしたか?
Nさん:プロジェクトメンバー全員がアクセスできるデータを探すのに苦労していたので、CO-ODEはすぐに活用できるオープンデータがパッケージになっていたため、とても使いやすかったです。経済産業省のデータひとつをとっても、通常であれば自分たちできれいに加工してやっと使えるデータになるのですが、CO-ODEはその手間が省けるデータだったことがありがたかったです。
CO-ODEは毎月新しいデータにアップデートされ、かつ手軽にデータを入手できるように整備されていますし、例えば自社データにCO-ODEで取得したオープンデータを掛け合わせて分析を深めることも可能です。
さらに最近はSnowflakeマーケットプレイスにCO-ODEがデータプロバイダーとしてデータの提供も開始したので、今後もさらなるアップデートを期待しています。
Nさん、今回は素敵なお話をありがとうございました。SAS ハッカソンのプロジェクトの内容から、SAS Viyaの魅力やCO-ODE活用法についてもお話いただきました。今後もますますのご活躍を期待しております!
<SAS Viyaについての関連記事>
使ってみましたシリーズ 第6弾 【SAS Viya】で品質管理編を受講してみた 使ってみましたシリーズ 第7弾 【SAS Viya】で需要予測編を受講してみた
ジールでは SAS Viya をベースとした、部門単位で始められる DX スターターパックもご用意しております。社内にデータアナリストがいなくても業務改革やデータ解析をクイックに実施したいお客様におススメです。
▼DX・AIの導入をご検討の方はこちらまでお問い合わせください。
DX スターターパック、AI スターターパック
▼オープンデータや外部データを収集・加工して配信しているサービス
CO-ODE
▼<小売業向け> データ分析で起こる課題を外部データで解決
ウェビナー