이 섹션의 질문은 데이터 분석, 데이터 엔지니어링, 머신러닝에 관련된 개발자 또는 직무 역할이 데이터 분석가/데이터 엔지니어/데이터 과학자인 개발자에게만 표시되었습니다. 이 설문조사는 특히 개발자를 대상으로 했기 때문에, 이 결과가 더 넓은 빅 데이터 대상자를 대표하지 않을 수 있습니다.
빅데이터
스프레드시트 에디터는 데이터 분석 및 시각화에 가장 많이 사용되는 도구입니다(46%).
대다수의 빅 데이터 개발자는 특정한 데이터 분석 플랫폼을 사용하지 않습니다(68%). 가장 많이 사용되는 데이터 분석 플랫폼은 Google Colab(19%)입니다.
Jupyter는 빅 데이터 개발자의 32%가 사용하는 가장 인기 있는 빅 데이터 도구입니다. 다른 인기 있는 도구로는 Apache Spark(20%)와 Apache Kafka(17%)가 있습니다.
데이터는 대부분 내부 서버(36%) 또는 로컬(26%)에서 호스팅됩니다. 응답자의 21%가 데이터 호스팅에 AWS를 사용하고 있으며 다른 유형의 호스팅 사용 빈도는 이보다 적습니다.
비 IT 부문에서 데이터 엔지니어는 금융 부문에 고용되는 경우가 더 많은 반면, 머신러닝 전문가는 교육 및 과학 부문에서 일하는 경우가 더 많습니다.
Python이 Apache Spark와 함께 사용되는 비율은 66%이고 Java 및 Scala가 함께 사용되는 비율은 각각 34%와 11%입니다.
10%는 Apache Spark와 Apache Kafka를 모두 사용합니다. 9%는 Apache Spark와 Apache Hadoop을 모두 사용합니다.
Apache Kafka와 함께 가장 많이 사용되는 세 가지 언어는 Python, Java 및 SQL입니다.
R은 러시아(5%)에서 더 널리 사용되고 Python은 아시아(59%)에서 더 널리 사용됩니다.
Python 및 Java는 Google Cloud에서 더 일반적으로 사용되고, JavaScript 및 PHP는 AWS에서 더 일반적으로 사용되며, C#은 Azure에서 더 일반적으로 사용됩니다.
Jupyter 및 Apache Beam은 Google Cloud와 함께 더 일반적으로 사용됩니다. Apache Spark 및 Apache Kafka는 AWS 사용자 사이에서 더 일반적으로 사용됩니다.
머신러닝 전문가는 데이터 분석 및 데이터 엔지니어링에 관련된 개발자와 비교할 때 Python, C++ 및 C를 더 일반적으로 사용하고 SQL 및 PHP를 덜 사용합니다.
Python과 R은 일반적으로 교육 및 과학에 관련된 개발자들이 더 많이 사용합니다.
Jupyter는 교육 및 과학 분야에서 더 일반적으로 사용됩니다. Apache Spark, Apache Kafka, Apache Hadoop 및 Apache Hive는 은행 업무에 더 자주 사용됩니다.
Apache Spark 사용자는 중국, 인도, 한국, 스페인 및 라틴 아메리카에 가장 많이 분포해 있습니다.
읽어주셔서 감사합니다!
이 보고서가 여러분에게 도움이 되었길 바랍니다. 이 보고서를 친구와 동료에게 공유해 주세요.
JetBrains Tech Insights Lab에 참여하세요
질문이나 제안이 있으면 surveys@jetbrains.com으로 연락해 주세요.