
求む!データ・サイエンティスト!!
本格的にビックデータ時代を迎える今、そこから流れてくる膨大なデータを分析するデータアナリストも重要になってきました。
世界が「データ・サイエンティスト」の確保のために取り組んでいる対策とこれからを予想します 。
IoTによる「データ洪水」が目前に迫る今、
それを解析するデータ・サイエンティストを十分に確保できるのか?
騒がれ続けてきたモノのインターネット(IoT)が、いよいよ具現化され始めています。GEではすでに、管理している1兆ドル相当の産業機器に設置された1,000万個のセンサーから得られるデータの流れを分析しています。しかしガートナー社の予測によれば、5年以内にインターネットに接続されるデバイス数はなんと260億にのぼるとか。とてつもない量のデータが生み出されることになります。
これほど膨大な情報に対処するには、当然ながら相当数の熟練した人材が必要に。しかし、どのくらい人材が足りないのか、人材不足によって生じるギャップがどれほどになるのか明確な予測はありません。マッキンゼー・グローバル・インスティテュートは2011年の段階で、近い将来米国内で「高い分析能力を持つ人材が14万人から19万人」、「管理者やアナリストが150万人」不足することになると警告。ガートナー社も2012年の段階で、2015年までに世界中でデータ分析をサポートするために必要とされる440万のIT関連のポジションのうち、実際に人材を確保できるのはわずか3分の1に過ぎないと予測しています。さらに、今年に入ってEUも、2020年に82万5,000人を上回る労働力不足が生じるという予測を発表しています。
予測が難しい理由の一つは、データ・サイエンティストは統計、コンピュータ、データ管理、解析といった様々な分野の能力を独特のバランスで持ち合わせる必要があること。もちろん、そんな人材を一朝一夕に輩出することなど不可能です。2013年、米国の大学ではバイオメトリクス/生物統計学、コンピュータ・サイエンス、統計学、素粒子物理学の分野で計2,342の博士号が授与されました。データ・サイエンティストの一般的なリクルート先として考えられている分野にこれだけしか人材がいないのに対し、すでにデータ・サイエンティストを必要としているポジションは数万人規模。人材不足は もはや明白。
諸外国では官民を問わず、様々な機関でデータ・サイエンティスト育成のための手段が講じられています。EUでは、デジタル職種のための大連立を導入、若い人たちに技術系職種に興味を持ってもらうと同時にすでに就労している人材のスキルアップを図るべく、各種関連業界や学校との協力を始めています。シンガポールも、データ分析のノウハウを政府と各業界に蓄積するための取り組みを推進中。昨年2月、米オバマ政権はシリコンバレーの著名人であるD. J.パティル氏をデータ・ポリシーの最高技術副責任者兼チーフ・データサイエンティストに任命しました。
日本でも、総務省統計局及び統計研修所が日本統計学会等と協力し、統計力向上サイト「データサイエンス・スクール」を統計局ホームページに開設したほか、MOOCの手法を用いた「データサイエンス・オンライン講座」を開設。大学や企業内においても、様々なデータ・サイエンティスト育成への取り組みがスタートしています。
しかし、政府も企業も、まずは今現在のニーズに応えなくてはなりません。その答えの一つが、アクセンチュア社によって進められているチーム・アプローチです。つまり、データ・サイエンティストに求められる職務を、チーム内で分割して担当しようというもの。Accenture Institute for High Performanceのシニアリサーチ・フェロー、アラン・アルター氏は「データ・サイエンティストとは、データ・エンジニア、科学者、管理者、教師のすべての素質を併せ持った人。その人物の仕事を、要素ごとに分割して、チームで業務をこなせばいい」と指摘します。
これに対し、クラウドソーシングの活用を提案するのはマサチューセッツ工科大学スローン・マネジメント・スクールのリサーチ・フェロー、マイケル・シュラージ氏。たとえば、クラウド・ソリューションやブロードバンド・インターネットの活用で、企業は膨大なデータをコスト効率よく転送し、リモートで分析することが可能になります。
ここでは”自動化”も重要な要素です。シュラージ氏は、現在の複雑なデータ分析業務の半分は、5年以内にそれほど専門性の高くない作業者でもソフトウェアの助けを借りて処理できるようになるはず、と期待しています。「データ処理の世界では、難度でみたときに現在上位2%に位置する類の業務が、5年も経たないうちに全体の4分の1を占めるようになるでしょう」と同氏は言います。ただ、ツールやアウトソーシング、トレーニングが整っても、すべての企業に成功が保証されるわけではありません。例えるなら、医療が行き渡っているからといって「やぶ医者による誤診がなくなるわけではない」のと同じ。自動化ツールにしても、原理原則を理解せずに使えば、大きな誤用を招く可能性があります。
本格的なビッグデータ時代を迎える今、いかにしてデータ・サイエンティストを育成し、確保するか。これを怠れば、“時代の変革という波“に乗り損ねかねません。