Notebooks

Jupyter Notebook es el corazón de cualquier proyecto de ciencia de datos. Datalore le ofrece herramientas inteligentes para trabajar con Jupyter Notebooks. La asistencia a la codificación inteligente para Python, SQL, R, Scala y Kotlin le permitirá avanzar más rápido y escribir código de mayor calidad con menos esfuerzo. El editor Datalore le ofrece un acceso rápido a todas las herramientas esenciales, entre las que se incluyen fuentes de datos adjuntas, visualizaciones automáticas, estadísticas de conjuntos de datos, un generador de informes, un gestor de entornos, control de versiones y mucho más.

En el siguiente vídeo verá lo fácil que es crear Jupyter Notebooks en Datalore:

Compatible con Jupyter

Los Notebooks en Datalore son compatibles con Jupyter, lo que significa que puede cargar sus archivos IPYNB existentes y seguir trabajando con ellos en Datalore. Además, también puede exportar Notebooks como archivos IPYNB. Tenga en cuenta que las conexiones de datos y los controles interactivos no se exportarán.

Python Notebooks

Asistencia a la codificación inteligente de PyCharm

Datalore incorpora las funcionalidades de información acerca del código de PyCharm. En los Python Notebooks se obtiene una finalización de código de primera clase, información sobre parámetros, inspecciones, correcciones rápidas y refactorizaciones que ayudan a escribir código de mayor calidad con menos esfuerzo.

Documentación en la aplicación

Obtenga ventanas emergentes de documentación para cualquier método, función, paquete o clase. Datalore le mostrará la documentación justo donde la necesita.

Compatibilidad con Conda y Pip

Datalore es compatible tanto con Pip como con Conda. Pip es rápido y gratuito para todo el mundo, mientras que Conda es gratuito solo para uso no comercial.

Notebooks de Kotlin, Scala y R

En Datalore puede crear Notebooks de Kotlin, Scala y R. Puede usar magic para instalar paquetes, y al escribir código disfrutará de la finalización de código.

Celdas SQL

Añada celdas SQL nativas para consultar sus conexiones de base de datos. Además de resaltar la sintaxis de SQL, se obtiene la finalización del código basada en las tablas de la base de datos introspeccionadas. El resultado de la consulta se transfiere automáticamente a un DataFrame de pandas y se puede seguir trabajando con el conjunto de datos en Python.

Consulta de DataFrames mediante celdas SQL

Utilice las celdas SQL para consultar fácilmente DataFrames 2D y archivos CSV de documentos adjuntos, como haría con cualquier otra base de datos. Solo tiene que navegar por los DataFrames del notebook, elegir uno y utilizarlo como fuente para las celdas SQL. Con esta funcionalidad, puede combinar datos de varias fuentes en un único DataFrame mediante SQL o descomponer consultas complejas en una secuencia de celdas SQL.

Compatibilidad con variables en celdas de Markdown

Incruste sus variables en celdas de Markdown con llaves dobles. Las variables se convertirán de forma dinámica a sus valores reales dentro de su texto.

Entorno

Gestor de paquetes

Datalore incorpora un gestor de paquetes integrado que hace que su entorno sea reproducible. El gestor de paquetes le permite instalar y gestionar nuevos paquetes y se asegura de que continúen ahí cuando vuelva a abrir el Notebook.

Entornos de base personalizados

Cree varios entornos base a partir de imágenes Docker personalizadas. Puede preconfigurar todas las dependencias, las versiones de los paquetes y las configuraciones de las herramientas de compilación para que su equipo no pierda tiempo instalando cosas manualmente y sincronizando las versiones de los paquetes.

Paquetes de repositorios Git

Instale un paquete personalizado compatible con pip desde un repositorio Git adjuntando una rama Git a su Notebook.

Scripts de inicialización

Configure un script que desee ejecutar antes de que se inicie el Notebook. Aquí puede especificar todas las herramientas de compilación necesarias y las dependencias que requiera.

Visualizaciones

Pestaña de visualización

Obtenga opciones de visualización automáticas dentro de la pestaña Visualize para cualquier DataFrame de pandas. Los gráficos de puntos, líneas, barras, áreas y correlaciones le ayudarán a comprender rápidamente el contenido de sus datos. Si el conjunto de datos es grande, se muestreará de forma automática. Todos los gráficos pueden extraerse al código o a las celdas del gráfico para su posterior personalización.

Compatibilidad con todos los paquetes de visualización de Python

Cree visualizaciones con el paquete de su elección. Matplotlib, plotly, altair, seaborn, lets-plot y muchos otros paquetes son compatibles con los Notebooks Datalore.

Celdas de gráficos

Cree visualizaciones listas para la producción con solo unos pocos clics. El estado de las celdas se comparte con los colaboradores para que puedan trabajar juntos en la visualización.

Resultados en tablas interactivas

Filtre y ordene los Pandas DataFrames y los resultados de las consultas SQL directamente en las celdas. Seleccione las columnas que mostrar, ordene el conjunto de datos por columnas, filtre por expresiones como «equal» y «contains», y salte fácilmente a la parte superior o inferior del conjunto de datos. Tras filtrar y ordenar, utilice la opción Export to code cell para generar el fragmento de código Pandas y hacer que la vista de la tabla sea reproducible.

Editar celdas de DataFrame en tablas interactivas

Ya no necesita descargar archivos CSV para realizar un conjunto de ediciones en un DataFrame. Puede simplemente editar el contenido de las celdas dentro de las tablas interactivas y hacer clic en Export to code para reproducir el resultado en el notebook.

Estadísticas de DataFrame

Con un solo clic, puede obtener las estadísticas descriptivas básicas para un DataFrame en una pestaña independiente llamada Statistics. Para las columnas de categoría, verá la distribución de los valores, y para las columnas numéricas, Datalore calculará el mínimo, el máximo, la mediana, la desviación estándar y los percentiles, y resaltará el porcentaje de ceros y de valores atípicos.

Controles interactivos

Añada entradas interactivas, como listas desplegables, deslizadores, entradas de texto y celdas de fecha en sus Notebooks, y utilice los valores de entrada como variables dentro de su código. Presente las visualizaciones con celdas de gráficos y resalte determinados números dentro de las celdas de métricas.

Control interactivo del cargador de archivos

Ahora, los propietarios de informes y notebooks pueden permitir que los colaboradores carguen archivos CSV, TXT o de imagen desde sus máquinas locales. Establezca tipos de archivo y límites de tamaño para incorporar sin problemas la carga de archivos a su flujo de trabajo.

Exportar a celdas de bases de datos

Exporte DataFrames a tablas existentes de una base de datos directamente desde su notebook. Personalice la exportación eligiendo el DataFrame, la base de datos de destino, el esquema y la tabla. Además, puede aprovechar la función de programación y automatizar las exportaciones.

Compatibilidad con IPyWidgets

Datalore es compatible con IPyWidgets, el clásico marco de trabajo de widgets de Jupyter. Añada controles interactivos con código Python, combine varios widgets en una celda de salida y utilice la selección como una variable en las siguientes partes del Notebook.

Vistas previas de archivos CSV

Abra los archivos CSV y TSV desde la pestaña Attached data en una pestaña independiente en el editor de Datalore. Ordene los valores de las columnas y pagine el contenido del archivo.

Edición de archivos CSV

Cree y edite archivos CSV y TSV directamente en el editor de Datalore. Puede empezar desde cero y crear un nuevo archivo o editar el contenido de uno que ya exista.

Terminal

Abra ventanas de Terminal dentro del editor, ejecute scripts .py y acceda al agente, al entorno y al sistema de archivos utilizando comandos bash estándar.

Visor variable

Navegue entre las variables del Notebook y los valores de los parámetros integrados desde un solo lugar.

Control de versiones internas

Cree puntos de control del historial personalizados que le permitan revertir los cambios en cualquier momento mediante la herramienta de historial. Al navegar por un punto de control, verá la diferencia entre la versión actual del Notebook y la que está seleccionada.

Computación

Ejecute Notebooks en CPU y GPU

En Datalore, puede ejecutar sus Notebooks en CPU y GPU. Puede elegir la máquina que necesite desde la interfaz de usuario. El tipo y la cantidad de recursos que obtiene depende del plan que tenga. Encontrará más información aquí.

Nube privada y máquinas locales

Puede conectar a Datalore cualquier tipo de hardware de servidor que ya esté utilizando y hacerlo accesible a sus usuarios desde la interfaz de Datalore.

Modo reactivo para una investigación reproducible

El modo reactivo aplicará el orden de evaluación descendente y el recálculo automático de las celdas inferiores a la que se ha modificado. El estado del Notebook se guardará después de la evaluación de cada celda y podrá restaurarse en cualquier momento.

Computación en segundo plano

Cambie a la computación en segundo plano para que su Notebook siga funcionando incluso cuando cierre la pestaña del navegador. Siempre tendrá acceso a su lista de cálculos en curso desde el menú de usuario o el panel de administración.

Informes de utilización de las máquinas

Descargue informes CSV que indican la cantidad de tiempo que ha invertido en el funcionamiento de cada máquina: puede ayudarle a entender a qué proyectos ha prestado más atención.

Programación de notebooks

Utilice la programación para ejecutar sus notebooks cada hora, cada día, cada semana o cada mes, y entregue actualizaciones periódicas de los informes publicados. Seleccione los parámetros de programación desde la interfaz de usuario o utilice la cadena CRON. Notifique a los colaboradores del notebook las ejecuciones exitosas o fallidas por correo electrónico.

Varias programaciones para notebooks

Especifique y gestione varias programaciones para un mismo notebook a través de la interfaz de usuario. Esta funcionalidad le permite crear programaciones personalizadas y ejecutar su notebook cada hora, cada día, cada semana o en fechas concretas. Con la posibilidad de establecer distintas programaciones en función de sus necesidades específicas, puede lograr una asignación de recursos más eficaz y adaptar los plazos de ejecución del código a las exigencias de su proyecto.

API de ejecución de Datalore

Ya se puede desencadenar la ejecución de un notebook de Datalore o la nueva publicación de un informe con una llamada a la API. Esta funcionalidad se añade a la de las ejecuciones programadas, que le permite desencadenar la nueva ejecución de un notebook a petición desde aplicaciones externas y notebooks internos de Datalore. También se pueden ver los resultados de la ejecución desde el menú Scheduled run. Aquí encontrará más información sobre cómo utilizar la API.

API de ejecución de Datalore

Compatibilidad nativa con paquetes R

Ahora, puede instalar paquetes para cuadernos R desde repositorios de paquetes R públicos y privados compatibles con install.packages desde la pestaña Environment manager. Environment manager permite conservar la configuración del entorno durante la ejecución del cuaderno. Es posible configurar un repositorio personalizado creando un archivo .Rprofile en init.sh o una imagen personalizada de un agente.

A pesar de que la instalación de conda sigue siendo la predeterminada en la versión en la nube, los clientes Enterprise pueden configurar un entorno base personalizado que no sea conda con el kernel de R. Esto hará que no haya paquetes conda en los resultados de búsqueda de Environment manager. Puede ver un ejemplo de dicha instalación aquí.

Compatibilidad nativa con paquetes R

Búsqueda de contenido en los cuadernos

Localice secciones de código concretas o encuentre la información que necesita en todos los cuadernos de sus espacios de trabajo. Además de buscar nombres de cuadernos, ahora puede buscar nombres de variables y contenido. La consulta aparecerá resaltada en los resultados de la búsqueda.

Búsqueda de contenido en los cuadernos