データサイエンティストに対する需要は増加しています。
化学工学や機械、電気、制御を専門とされる方もデータサイエンス分野へのスキル拡張を考えているかもしれません。
今回はデータサイエンティストに求められるスキルについて解説します。
私の化学メーカーでの経験を基に、特にプロセス産業の方がイメージしやすい内容になっています。
なお本記事を作成にあたりデータサイエンティスト協会の考え方を参考にしています。
データサイエンティストとは?
まずはデータサイエンティストが何かについて解説します。
定義
データサイエンティスト協会ではデータサイエンティストについて以下のように定義されています。
データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル
データサイエンティストのためのスキルチェックリスト/タスクリスト概説
需要
近年データサイエンティストの需要が著しく増加しています。
データサイエンティストについてはIT人材白書2020にて336企業を対象にとったアンケート結果がまとめられています。
そこには約7割の企業でデータサイエンティストの重要性を認識していると記載されています。
更にデータサイエンティストがいないながらも重要性を感じている企業が約4割、人材不足を感じている企業は約6割です。
求められるスキル
先に述べた定義に対して「データサイエンス力」「データエンジニア力」「ビジネス力」の3つにスキルを分類することができます。
求められるスキル
- データサイエンス力
情報処理・人工知能・統計学などの情報科学系の知恵を理解し使う力。
課題に対してどのような手法を用いて解決するかを検討する際に力を発揮する。
- データエンジニア力
データサイエンスを意味のある形として扱えるようにして、実装・運用する力。
分析のためのIT基盤を構築する際に力を発揮する。
- ビジネス力
課題背景を理解し、ビジネス課題を整理・解決に導く力。
テーマを設定したり得られた結果に対して結論を導く際に力を発揮する。
ドメイン知識
先に解説した3つのスキルの他にドメイン知識が必要となります。
ドメイン知識とは分析を行いたい各業務における専門的な分野の知識を指します。
例えば各製品の製造方法や特性、設備の仕組みなどです。
ドメイン知識を持っていなければ解析結果に対して全く違った解釈をする恐れがあります。
そのためデータサイエンスの知識を既存業務の付加価値として新たに身につけることが人材育成として重要になると考えられます。
データサイエンティスト需要は無くなる?
ここまでデータサイエンティストに必要となるスキルを解説しましたが、そもそも将来性自体を疑問視している話も出ています。
それがAIによる業務代替です。
データサイエンティスト協会としてはAIを生かしたうえで更なる付加価値を生み出すために人間が必要になると述べています。
多くの企業や分野でデータサイエンティストが求められ、人材不足が懸念される状況にもなっています。
データサイエンティストのためのスキルチェックリスト/タスクリスト概説
その一方で、「データサイエンティストの仕事も将来的にはAIに取って代わられるのでは……」という声も聞かれるようになりました。
もちろん、人間よりもAIが計算・処理した方が速度も速く精度も高い識別や予測などの領域は、AIに代替されていくものでしょう。
しかし、どのようにデータを使って社会にどのような価値を生み出すかをデザインし実行していくことは、人間にしかできない仕事です。
既にAIのパラメータ調整をAIで行うなど人間が行う作業の代替が着実に進んでいます。
ただしコスト対効果の面や全体への普及を考えると早々に需要が無くなるということはないと思われます。
今後も必要となるドメイン知識を基盤に、データサイエンス分野の知識を身につけることで必要な人材として継続して受け入れられるでしょう。
私は特に「どのデータを使うか」「そのためにどうやって収集するのか」「収集したデータが質の高いものであるのか」などの判断ができる力は今後も特に重要になると考えています。
最新のスキル需要動向
データサイエンティスト協会では学習に役立てるためスキルチェックリストを公開しています。
2021年11月19日に最新版であるスキルチェックリスト ver.4が公開されました。
以下グラフにある通り、年々必要となるスキルが増加しています。
各種スキルに対して以下の変更があります。
データサイエンス力に関しては非構造化データの更なる利用と解析精度向上に注目されている印象です。
データサイエンス力の変更概要
- 「因果推論」「標本抽出」「自然言語」「画像認識」の重要度が増加
- 「Attention」「データドリフト」など新技術に関する項目を追加
- 「集合論基礎」を数学分野に追加
- 「一般化線形モデル」「一般化線形混合モデル」に関する項目を追加
データエンジニアリング力に関しては開発の省力化やクラウド利用に注目されている印象です。
データエンジニアリング力の変更概要
- 「プログラム開発」「セキュリティ」の重要度が増加
- 「AIシステム運用」「クラウド環境構築」に関する項目を追加
- 「通信技術」「設計開発技術」など新技術に関する項目を追加
- 「GPU」「Hadoop」など一般化技術の一部削除
ビジネス力に関してはデータ分析者のデータ利活用技術や倫理的側面に注目されている印象です。
ビジネス力の変更概要
- 「データ・AI倫理」「アプローチ設計」の重要度が増加
- 「AI活用検討」など状況に応じた活用能力に関する項目を追加
まとめ
今回はデータサイエンティストに求められるスキルについて解説しました。
データサイエンティストに求められるスキルは幅広く、全てを身につける必要はないと考えています。
数あるスキルの中から自身が特化したいスキルを選択し、周辺知識もある程度身につけることが重要です。
それぞれのスキルについて以下の記事で個別に解説しています。