こんにちはこんばんは。インハウスチームのonoeです。
今年の6月、私はデータサイエンティスト検定リテラシーモデルという資格を受験しました。
なぜ受験した?
私が所属しているインハウスシステム課では、ヌーラボのデータ基盤を運用しています。データ基盤には社内の様々なデータを集めているのですが、データをどう活用するか、についてはまだ手探りの部分も多く試行錯誤しています。
たとえば、いくつかのデータをグラフ化して眺めてみても、次にどういうアクションをとればいいのか分からない、仮説を立ててみてもその仮説が妥当なのかどうか判断しきれない、といったような状態でした。
私自身、データに関する知識はあるが断片的な知識しかない、という課題を持っていて、この状況を突破するために体系的な知識を学習したほうがいいのではないか、と考えていました。
現在、データ活用に関する書籍はたくさんありますが、体系的に書かれているものは少なく、特定分野(たとえば統計学、データ基盤についてなど)に対して書かれているものが多いと思います。そのため学習したとしても、特定分野の知識に偏ってしまうのでは・・・・と感じていたところにデータサイエンティスト検定というものがあることを知りました。この検定は試験範囲となっている分野も幅広いので、体系的に学習できるのではと考え、受験することにしました。
データサイエンティスト検定とは
データサイエンティスト検定は、一般社団法人データサイエンティスト協会が実施している「データサイエンティスト(見習いレベル)に値する実務能力と知識を有することを証明する試験」で、
-
- データサイエンティスト初学者
- これからデータサイエンティストを目指すビジネスパーソン
- データサイエンティストに興味を持つ大学生や専門学校生など
が対象となっています。
試験内容は、下記3つの団体がそれぞれ策定しているデータサイエンスに関する資料の内容がベースになっています。
-
- データサイエンティスト協会が策定している「スキルチェックリスト」
- IPAが策定している「ITSS+ データサイエンス領域タスクリスト」
- 数理・データサイエンス・AI教育強化拠点コンソーシアムが公開している「モデルカリキュラム (リテラシーレベル)」
上記には重複した部分があるため、これらをそれぞれ統合した内容の問題が出題されます。
試験問題は大きく3つの分野で構成されています。
-
- ビジネス力
課題背景を理解した上でビジネス課題を整理し、解決する力 - データサイエンス力
情報処理、人工知能、統計学などの情報科学系の知恵を理解し使う力 - データエンジニアリング力
データサイエンスを意味のある形に使えるようにし実装・運用できるようにする力
- ビジネス力
ビジネス力には、数理・データサイエンス・AI教育強化拠点コンソーシアムが公開している「モデルカリキュラム」の範囲も含まれています。「モデルカリキュラム」には「社会におけるデータ・AI利活用」というセクションがあり、社会でのデータ活用例や、今後の動向、データ活用の法的・倫理的な知識が出題されます。
データサイエンティスト検定の試験範囲は、数学や統計の基礎的なところから、エンジニアリング(DBに関する知識、プログラミング、セキュリティ)、ビジネスに関する部分まであるので、範囲はなかなか広いと言えるでしょう。ただ、各分野において深い知識を求められるわけではないので、「データを活用するために必要な基礎知識」という位置づけになると思います。
割合としてはデータサイエンス力が一番多く、全体の半分程度がデータサイエンス力の範囲にあたります。
試験勉強を通して感じたこと
試験勉強は、参考書・問題集とスマホアプリ、動画教材で1ヶ月半ほど取り組みました。
数学は忘れてしまってることも多いし、統計学と機械学習、深層学習はそもそも知識が少ないし・・・・という状態からスタートしたので、データサイエンス力の勉強が特に苦労しました。逆に、データエンジニアリング力やビジネス力については、業務に関連しているところも多く楽に進めることができたので、勉強時間の多くはデータサイエンス力のところに割きました。
また、勉強を進めていく中で、モデルカリキュラムの範囲にある「ELSI(科学技術の倫理的・法制度的・社会的課題)」や「人間中心の AI 社会原則」といった、データ活用時のリスクやガイドラインに関する知識を得ることができたのは良かったです。
データ活用を考える際、どうすればデータを使えるか、という点に目が行きがちですが、「そもそもそのデータは使っていいのか」「正しい使い方をしているのか」「倫理的な問題はないのか」といった点も同じぐらい重要です。
これらの観点が抜けてしまうと、データを使うことによって差別を助長してしまったり、プライバシーを侵害してしまったりする可能性があるので、こういった知識をあらためて学べたのはとても良い機会だったと思います。
データサイエンティスト検定を受けてみて
当初考えていた「体系的な知識を得たい」という目標は、試験勉強を通しておおむね達成できたように感じています。試験は広く浅い出題内容だったので、まだまだ深く学習していく必要はありますが、最低限の「データ活用リテラシー」は身についたのではないかなと思います。もし資格試験がなく、自分でこれらの範囲すべてを学ぶ必要があったとすれば、もっと手間がかかっていたかもしれません。
今回受験したのは「リテラシーレベル」でしたので、上位スキルレベルの試験がスタートすれば、またチャレンジしたいと思います。
また、データサイエンティスト検定では、企業がどのようにデータを活用する組織になっていくか、といったデータマネジメントに関する問題はほとんどありません。企業でデータ活用を推進する、ということを考えていくとデータマネジメントについては別の本で知識を補完するなどは必要かなと感じました。
(あ、試験は無事合格しました)
合格するとブロックチェーンで管理されたバッジがもらえます
(こちらのバッジは私個人で取得したものです)
データに関する国の動向
データサイエンティスト検定の話とは外れますが、国のデータに関する動向にも少し触れてみます。
データは「21世紀の石油」と言われており、政府もデータを活用できるデジタルスキルをもった人材の育成には力を入れているようです。たとえば経済産業省では、産業界においてDX(デジタルトランスフォーメーション)を推進するための学びの指針として「DXリテラシー標準」というものを策定していたりします。これは、DXに関する知識を体系的に学ぶための指針になっています。
また、国のデータとして、総務省統計局が公開している政府統計「e-Stat」や、経済産業省が提供している地域経済分析システム「RESAS」などがあり、国勢調査や地域経済のデータを手に入れることができます。それ以外にも様々なデータがオープンデータカタログサイトで公開されています。
加えて、データ活用のための無償の学習コンテンツも、政府が提供しているもの・大学が無償公開しているものなどたくさんありますので、データに興味ある方は活用してみてはどうでしょうか
最後に
今回、試験を通してとても良い知識を得ることができました。
ですが、机上の知識で終わっては意味がありませんので、これからは得た知識をどんどん実践していきたいなあと考えています。
ただし、データ活用は手段であり目的では有りません。
あくまで優れた意思決定を行うための手段です。
これからは得た知識に振り回されることなく、安全にデータを活用し、優れた意思決定を行い、そしてユーザーの皆様へより素晴らしい価値提供ができればと思います。
これからのヌーラボにご期待ください!