このセクションの質問は、データ解析、データエンジニアリング、機械学習に関与する開発者、またはデータアナリスト/データエンジニア/データサイエンティストを役職とする方に示されました。このアンケートは具体的に開発者を対象としているため、結果は、より幅広いビッグデータオーディエンスを代表するものではない可能性があります。
ビッグデータ
表計算エディターはデータ解析と視覚化に最も使用されているツールです(46%)。
ビッグデータ開発者の大半は、具体的なデータ解析プラットフォームを使用していません(68%)。最も一般的なデータ解析プラットフォームは Google Colab です(19%)。
ビッグデータ用のツールとしては、Jupyter が最も人気が高く、ビッグデータ開発者の 32% が使用しています。ほかには、Apache Spark(20%)と Apache Kafka(17%)にも人気が寄せられています。
データはほとんどの場合社内サーバー(36%)かローカル(26%)でホスティングされています。回答者の 21% は AWS でデータをホスティングしており、ほかのホスティングはそれほど一般的ではありません。
IT 以外の業界では、データエンジニアは金融業界で、機械学習専門家は教育および科学の分野で雇用されていることがより一般的です。
Python を Apache Spark と使用している人は 66%、Java と使用している人は 34%、Scala と使用している人は 11% です。
10% は Apache Spark と Apache Kafka の両方を使用しています。9% は Apache Spark とApache Hadoop の両方を使用しています。
Apache Kafka と使用されている 3 大言語は Python、Java、および SQL です。
他の地域に比べ、ロシアでは R(5%)が使用されています。アジアでは Python(59%)がより広く使用されています。
Python と Java は Google Cloud で、JavaScript と PHP は AWS で、C#は Azure で最も一般的に使用されています。
Google Cloud とともに一般的に使用されているのは Jupyter と Apache Beam です。Apache Spark と Apache Kafka は AWS ユーザーの間でより一般的に使用されています。
データ解析およびデータエンジニアリングに携わる開発者に比べ、機械学習専門家はより一般的に Python、C++ 、および C を使用しており、SQL と PHP はあまり一般的ではありません。
Python と R は教育と科学の分野に関与している開発者で、より一般的に使用されている言語です。
Jupyter の使用は、教育と科学の分野でより一般的に使用されています。Apache Spark、Apache Kafka、Apache Hadoop、および Apache Hive はバンキングが一般的です。
Apache Spark ユーザーは、中国、インド、韓国、スペイン、およびラテンアメリカで最大のシェアを示しています。
ご覧いただきありがとうございました!
レポートはお役に立ちましたか?
ぜひこのレポートを友人や同僚と共有してください。
JetBrains Tech Insights Lab にご参加ください
ご質問やご提案がございましたら、surveys@jetbrains.comまでお問合わせください。