10 Consejos y Trucos de Jupyter Notebook para Científicos de Datos

'10 tips and tricks for Jupyter Notebook for Data Scientists'

Desbloquea todo el potencial de Jupyter Notebook con consejos y técnicas expertas, incluyendo atajos que ahorran tiempo, funciones mágicas poderosas y características avanzadas, para aumentar tu productividad.

Ya seas principiante o profesional de datos, es probable que hayas utilizado Jupyter Notebook y hayas descubierto lo fácil que es ejecutar código Python y visualizar la salida en un formato de informe.

Pero, ¿qué tal si te dijera que puedes mejorar tu experiencia de desarrollo en Jupyter? En esta publicación, aprenderemos sobre 10 consejos para Jupyter Notebook para mejorar la productividad y el rendimiento de los profesionales de datos.

1. Atajos de teclado

Los atajos de teclado son importantes para realizar tareas repetitivas y ahorrar tiempo. Puedes aprender sobre todos los atajos de teclado predeterminados haciendo clic en Ayuda > Atajos de teclado o presionando la tecla H.

La forma más fácil y popular de acceder a los comandos sobre la marcha es un paleta de comandos similar a VSCode. Puedes presionar Ctrl + Shift + P para invocar la paleta de comandos. Te permite buscar y ejecutar comandos o desplazarte por todos los comandos para descubrir el que deseas ejecutar.

2. Comandos mágicos de IPython

Puedes acceder a todos los comandos mágicos de IPython dentro de Jupyter Notebook. Estos comandos te dan capacidades adicionales para ejecutar el código.

Por ejemplo, puedes usar el comando mágico %%time para mostrar el tiempo de ejecución de la celda. En nuestro caso, el código tardó 1,09 segundos en ejecutar 1000 iteraciones.

%%time

import time
for i in range(1_000):
    time.sleep(0.001)

Tiempo de CPU: usuario 10,2 ms, sys: 1,68 ms, total: 11,9 ms
Wall time: 1,09 s

Puedes aprender sobre todos los comandos mágicos disponibles ejecutando el comando %lsmagic o consultando los Comandos mágicos integrados.

Lista de comandos comúnmente utilizados:

  • %env para establecer variables de entorno.
  • %run para ejecutar el código Python.
  • %store para acceder a las variables entre varias notebooks.
  • %%time da el tiempo de ejecución de una celda.
  • %%writefile guarda el contenido de la celda en un archivo.
  • %pycat muestra el contenido del archivo externo.
  • %pdb se utiliza para la depuración.
  • %matplotlib inline para suprimir la salida de la función en la línea final.

3. Ejecutando comandos de Shell

Puedes ejecutar comandos de Shell y Bash dentro de la celda de Jupyter Notebook utilizando !, como se muestra a continuación. Te proporciona una capacidad adicional para ejecutar comandos y herramientas basados en Unix o Linux.

!git push origin

El uso más popular de este comando es instalar paquetes de Python sobre la marcha.

!pip install numpy

También puedes instalar paquetes de Python usando el comando mágico %pip

%pip install numpy

4. Usando LaTeX para fórmulas

Mientras creas el informe de análisis de datos, necesitas proporcionar ecuaciones estadísticas o matemáticas, y Jupyter Notebook te permite renderizar ecuaciones complejas usando fórmulas de LaTeX.

Solo crea una celda de Markdown y envuelve tu fórmula de LaTeX con un signo de dólar $, como se muestra a continuación.

$\int \frac{1}{x} dx = \ln \left| x \right| + C$

Resultado:

5. Instalación de otros núcleos para Jupyter Notebook

Todos conocemos el kernel de Python, pero también se pueden instalar otros kernels y ejecutar el código en cualquier lenguaje.

Por ejemplo, si deseas ejecutar el lenguaje de programación R en Jupyter Notebook, debes instalar R e instalar IRkernel dentro del entorno de R.

install.packages('IRkernel')
IRkernel::installspec()

O, si has instalado Anaconda, simplemente puedes ejecutar el siguiente comando en la terminal para configurar R en Jupyter Notebook.

conda install -c r r-essentials

Para los amantes del lenguaje Julia, he creado una guía sencilla sobre cómo configurar Julia en Jupyter Notebook.

6. Ejecutar código desde un kernel diferente

También puedes ejecutar código desde múltiples kernels dentro de Python Jupyter Notebook usando comandos mágicos como:

  • %%bash
  • %%html
  • %%javascript
  • %%perl
  • %%python3
  • %%ruby

En el ejemplo, intentaremos ejecutar código HTML dentro del kernel de Python usando el comando mágico %%HTML.

%%HTML

<html>

<body>

<h1>Hola Mundo</h1>

<p>Bienvenido a mi sitio web</p>

</body>

</html>

Salida:

Similar a !, puedes ejecutar scripts de Shell usando %%script, lo que te permite ejecutar todos los kernels instalados en tu máquina. Por ejemplo, puedes ejecutar un script de R.

%%script R --no-save
print("Zepes")

Salida:

> print("Zepes")
[1] "Zepes"
>

7. Soporte para múltiples cursores

Puedes usar múltiples cursores para editar múltiples variables y sintaxis o agregar múltiples líneas de código. Para crear múltiples cursores, debes hacer clic y arrastrar el mouse mientras mantienes presionada la tecla Alt.

8. Mostrar imágenes, videos y audio en la salida

Puedes mostrar imágenes, videos y audio sin instalar paquetes adicionales de Python.

Solo tienes que importar IPython.display para obtener las funciones de Imagen, Video y Audio. Es muy útil cuando estás trabajando con conjuntos de datos no estructurados y aplicaciones de aprendizaje automático.

9. Procesamiento de grandes conjuntos de datos

Puedes procesar y consultar grandes conjuntos de datos usando la biblioteca IPython Parallel. Es la colección de scripts CLI para controlar conjuntos de procesos IPython construidos sobre el protocolo Jupyter.

Además, puedes usar la sesión PySpark con el comando sparkmagic.

Echa un vistazo al ejemplo del repositorio sparkmagic.

%%spark -c sql -o df_employee--maxrows 5
SELECT * FROM employee

Salida:

 age name
0   40.0    abid
1   20.0    Matt
2   36.0    Chris

10. Compartir Notebooks

Compartir los informes o el código fuente con las salidas es importante, y se pueden hacer de varias maneras:

  1. Convertir Notebooks en archivos HTML usando Archivo > Descargar como > HTML.
  2. Guardar Notebooks como PDFs usando Archivo > Descargar como > PDF.
  3. Guardar Notebooks como Markdown Archivo > Descargar como > Markdown.
  4. Crear blogs usando Pelican.
  5. Cargar el archivo .ipynb en Google Colab y compartirlo entre colegas.
  6. Compartir el archivo Notebook con el público usando GitHub Gits.
  7. Hospeda tu archivo en la nube o en un servidor externo y utiliza nbviewer para renderizar el Notebook.

Espero que hayas encontrado útiles mis 10 consejos sobre Jupyter Notebook. Si tienes sugerencias o consejos adicionales sobre Jupyter Notebook que te gustaría compartir, por favor no dudes en mencionarlos en los comentarios a continuación. Gracias por leer.

Abid Ali Awan (@1abidaliawan) es un profesional certificado en ciencia de datos que ama construir modelos de aprendizaje automático. Actualmente, se enfoca en la creación de contenido y la escritura de blogs técnicos sobre tecnologías de aprendizaje automático y ciencia de datos. Abid tiene una Maestría en Gestión de Tecnología y una Licenciatura en Ingeniería de Telecomunicaciones. Su visión es construir un producto de inteligencia artificial utilizando una red neuronal de grafos para estudiantes que luchan con enfermedades mentales.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Ingenieros del MIT desarrollan réplica robótica del ventrículo derecho del corazón

Los ingenieros de la prestigiosa Universidad Tecnológica de Massachusetts (MIT) han desarrollado una revolucionaria r...

Ciencia de Datos

10 Consejos y Trucos de Jupyter Notebook para Científicos de Datos

Desbloquea todo el potencial de Jupyter Notebook con consejos y técnicas expertas, incluyendo atajos que ahorran tiem...

Inteligencia Artificial

Conoce AudioLDM 2 Un marco de trabajo de IA único para la generación de audio que combina habla, música y efectos de sonido

En un mundo cada vez más dependiente de los conceptos de Inteligencia Artificial y Aprendizaje Profundo, el ámbito de...

Inteligencia Artificial

El gemelo malévolo de ChatGPT, 'WormGPT', está entrando silenciosamente en correos electrónicos y saqueando bancos.

SlashNext dice que WormGPT es un ejemplo de la amenaza que representan los modelos de IA generadores de lenguaje.

Ciencia de Datos

Cómo utilizar el método loc de Pandas para trabajar eficientemente con su DataFrame.

Entender cosas básicas como qué columnas hay en los datos, cuáles son los tipos de datos crudos y las estadísticas de...