En el mundo de los negocios y el análisis de datos, ser un profesional de limpieza de datos de Excel es un punto de inflexión. Todo el mundo quiere la máxima precisión y calidad de los datos, ¿verdad? Bueno, ¡aquí es donde Excel resulta útil! Limpiar sus datos significa eliminar esos molestos espacios en blanco, corregir errores y actualizar información obsoleta.
Puedes hacer todo esto muy fácilmente usando Excel Power Query. Este tutorial es su guía de referencia para dominar los conceptos básicos de la limpieza de datos en Excel. ¡Mantenemos las cosas simples para que puedas limpiar tus datos en poco tiempo! ¿Listo para hacer brillar tus datos? ¡Vamos a sumergirnos!
¿Qué es la limpieza de datos en Excel?
En la mayoría de los casos, los datos sobre los que desea realizar el análisis no están en un formato utilizable, es decir, contienen celdas en blanco, valores duplicados, columnas fusionadas, etc. Antes de utilizar estos datos para el análisis, debemos limpiarlos para que no proporcionen resultados irrelevantes. Garantiza precisión y fiabilidad en sus análisis.
Excel proporciona algunas técnicas para realizar la limpieza de datos fácilmente. Las técnicas más utilizadas son:
- Eliminar duplicados
- Analizar datos usando texto de columna
- PONER EN ORDEN
- Utilice Buscar y reemplazar para limpiar datos en Excel
- Seleccionar y tratar todas las celdas en blanco
- Validación de datos
- Convertir números almacenados como texto en números
- Resaltar errores
- Cambiar el texto a minúsculas/mayúsculas/corregir
- Usando la función de revisión ortográfica en Excel
Nota: Es fundamental hacer siempre una copia de seguridad de sus datos antes de realizar operaciones de limpieza importantes, ya que pueden provocar cambios irreversibles.
Cómo eliminar duplicados en Excel
Los datos duplicados se refieren a dos o más entradas que comparten los mismos valores en campos clave. Los datos duplicados pueden ocurrir en varios tipos de conjuntos de datos, como bases de datos, hojas de cálculo o tablas. Identificar y gestionar datos duplicados es esencial para mantener la calidad de los datos y garantizar un análisis preciso.
Ejemplo: En este ejemplo, las entradas para ID de estudiante 1 y ID de estudiante 3 están duplicadas porque tienen los mismos valores en las columnas Nombre, Apellido, Curso y Costo del curso. Puede eliminar datos duplicados con los siguientes pasos:
Paso 1: Vaya a la pestaña Datos y haga clic en Eliminar duplicados
Cambie a la pestaña Datos y seleccione «Eliminar duplicados» para eliminar fácilmente entradas idénticas
Paso 2: Seleccione Todas las columnas y haga clic en Aceptar
En este caso, queremos eliminar duplicados en función de todas las columnas, por eso elija «Seleccionar todas las columnas» y haga clic en «Aceptar».
YAparecerá la siguiente ventana emergente para eliminar 1 registro duplicado:
Paso 3: vista previa de los resultados
Cómo analizar datos en Excel
Esta característica de Excel es útil cuando tiene datos en una sola columna que desea dividir en varias columnas. Esto es especialmente útil cuando se trata de datos importados de fuentes externas, como archivos CSV, o cuando los datos no están organizados de una manera adecuada para su análisis.
Ejemplo: Considere un conjunto de datos en el que necesita dividir Nombre Completo en Nombre y Apellido:
Paso 1: Seleccione todos los datos, luego vaya a la pestaña Datos y haga clic en «Texto en columnas».
Necesitamos seleccionar los datos a los que necesitamos aplicar Texto en columnas, luego ir a la pestaña Datos y seleccionar Texto en columnas en Herramientas de datos.
Paso 2: Elija Espacio como delimitador y haga clic en Aceptar
Aquí, necesitamos dividir los datos según el espacio entre ellos. Por eso eligió el espacio como delimitador.
Paso 3: vista previa del resultado
Función TRIM: eliminar espacios adicionales en Excel
La función CORTAR en Excel se utiliza para eliminar espacios adicionales de una cadena de texto, dejando solo un espacio entre palabras y sin espacios iniciales ni finales.
Ejemplo: De los siguientes datos necesitamos eliminar los espacios adicionales y podemos hacerlo usando la función TRIM() en Excel.
Paso 1: escribe la fórmula TRIM
La función de recorte eliminará espacios adicionales de L2 y el resultado será visible en la celda M2.
=RECORTAR(L2)
Paso 2: copia las fórmulas con el controlador de relleno
Luego, arrastre el controlador de relleno (un pequeño cuadrado en la esquina inferior derecha de la celda) hacia abajo para copiar la fórmula para todo el rango.
Paso 3: vista previa del resultado
Los datos finales deberían verse como los siguientes.
Cómo usar Buscar y reemplazar para limpiar datos en Excel
La función «Buscar y reemplazar» en Excel es útil para localizar rápidamente datos específicos y reemplazarlos con nuevos valores. Esto puede resultar útil para corregir errores, actualizar información o realizar cambios en un conjunto de datos grande.
Ejemplo: De los siguientes datos necesitamos eliminar y reemplazar errores.
Paso 1: Iniciar sesión en Ctrl+H para iniciar la ventana «Buscar y reemplazar».
Se abrirá una ventana pidiéndole que reemplace la palabra. Puede ingresar la palabra que desea reemplazar y la palabra con la que necesita reemplazar.
Paso 2: Haga clic en Reemplazar todo después de ingresar los datos.
Ingrese Derk en «Buscar» y Dark en «Reemplazar con». Haga clic en «Reemplazar» para reemplazar la palabra.
Paso 3: Repita el paso 1 y el paso 2
Paso 3: vista previa del resultado
Cómo seleccionar y tratar todas las celdas en blanco
Eliminar filas en blanco en Excel es un proceso simple y se puede realizar usando filtros o una función especial.
Ejemplo: Considere los siguientes datos que contienen cuatro espacios en blanco. Se puede eliminar siguiendo los pasos:
Paso 1: Vaya a la pestaña Inicio, luego vaya a Ordenar y filtrar y elija Filtrar.
Debe seleccionar todos los datos y luego hacer clic en la pestaña Inicio. Luego elija Filtrar en Ordenar y filtrar. Aparecerá un signo de flecha en el encabezado de cada columna.
Paso 2: Deseleccione todas las columnas y seleccione solo (espacios vacíos) columna. Hacer clic Aplicar para.
Necesitamos verificar si hay celdas en blanco en los datos. Para hacer esto, seleccione la casilla de verificación de espacios en blanco.
Paso 3: Seleccionar y eliminar filas en lineas vacias.
Aparecerán registros con celdas en blanco. Seleccione datos y elimínelos para eliminar registros vacíos.
Etapa 4: Elegir Seleccione Todo y haga clic en Aplicar
Para ver los registros restantes después de eliminar las celdas en blanco, haga clic en Seleccionar todo y aplicar cambios.
Paso 5: vista previa del resultado
Cómo utilizar la validación de datos en Excel
La validación de datos en Excel es una herramienta poderosa que le permite establecer reglas o criterios para los datos ingresados en una celda o rango de celdas. Esto puede resultar especialmente útil para garantizar la precisión y coherencia de los datos.
Ejemplo: Considere los siguientes datos donde la columna Edad contiene -ve y un valor de edad decimal no válido. Podemos solucionar este problema siguiendo los siguientes pasos:
Paso 1: Vaya a la pestaña Datos y seleccione «Validar datos».
Seleccione los registros en la columna Edad y vaya a Validación de datos en la pestaña Datos para agregar validación a las columnas Edad.
Paso 2: Ingresar Validaciones
Elija «Número entero» y establezca el rango de edad «Entre» y «14-30». Esto permitirá que los usuarios solo ingresen a personas entre 14 y 30 años. Si el usuario intenta ingresar una edad mayor que esta, se mostrará un mensaje de error.
Paso 3: Proporcionar un mensaje de entrada
Este mensaje aparecerá cuando el usuario pase el cursor sobre cualquier celda para ingresar su edad. Esto los guiará sobre qué valor se espera en la celda.
Etapa 4: Envíe una alerta de error y haga clic en «Aplicar para»
Esta advertencia de error aparecerá después de que el usuario haya ingresado una entrada incorrecta en la celda.
Cómo convertir números almacenados como texto a números en Excel
Se refiere al proceso de cambiar datos numéricos almacenados como texto en formato digital en valores numéricos reales. A veces, los datos numéricos se almacenan como texto debido a problemas de formato o procesos de importación/exportación de datos. Esto puede generar problemas al realizar cálculos o análisis que requieran datos numéricos.
Ejemplo: Suponga que los siguientes números están en las celdas A1 a A6. Por defecto, los datos de estos números son como texto.
Paso 1: Ingrese la siguiente función en la celda B2
=VALOR(A1)
Esto cambiará el valor numérico en la celda A1 que se ingresó por error como texto a Número.
Paso 2: arrastra la fórmula para copiarla a otras celdas
Luego, arrastre el controlador de relleno (un pequeño cuadrado en la esquina inferior derecha de la celda) hacia abajo para copiar la fórmula para todo el rango.
Paso 3: vista previa del resultado
Los datos finales deberían verse como a continuación:
Cómo resaltar errores en Excel
En Excel puedes resaltar fácilmente errores en tu hoja de cálculo para identificarlos y corregirlos rápidamente. Los errores pueden incluir cosas como DIV/0!, VALUE!, REF!, NAME?, NUM!, N/A o NULL!. Estos errores pueden causar problemas al realizar cálculos o análisis que requieran datos numéricos. Es mejor abordar estos errores antes de continuar con un análisis más detallado.
Ejemplo: Supongamos que tenemos una columna de números con algunos errores intencionales. Aquí hay un conjunto de datos de ejemplo en la columna A.
Paso 1: Vaya a la pestaña Inicio, haga clic en Formato condicional y luego seleccione Nueva regla.
Para resaltar las celdas con errores, seleccione los datos, vaya a la pestaña Inicio y elija Nueva regla en Formato condicional.
Paso 2: Seleccione el formato y haga clic en Finalizar
Aparecerá una ventana donde podrá aplicar el formato. Elija «Resaltar celdas con» y «Errores» en Tipo de regla. Agregue el formato «Relleno rojo claro con texto rojo oscuro». Haga clic en «Aplicar»
Paso 3: vista previa del resultado
Cómo cambiar el texto a minúsculas/mayúsculas/correcto
En Excel, puede cambiar fácilmente las mayúsculas y minúsculas del texto mediante funciones o fórmulas integradas. Esto mejora la legibilidad de sus datos.
Ejemplo: Supongamos que necesitamos convertir los siguientes datos a mayúsculas/minúsculas/adecuado.
1. Función SUPERIOR
Utilice la función MAYÚSCULAS para convertir texto a mayúsculas. Siga el siguiente ejemplo:
2. Función BAJAR
Utilice la función INFERIOR para convertirlo a minúsculas. Siga el siguiente ejemplo:
3. Función CORRECTA
Si desea convertir el texto a mayúsculas y minúsculas (poniendo en mayúscula la primera letra de cada palabra), utilice la función ADECUADA.
Cómo utilizar la función de revisión ortográfica en Excel
La revisión ortográfica en Excel es una función útil para limpiar datos, especialmente cuando se trata de datos de texto. Ayuda a identificar y corregir errores ortográficos en su hoja de cálculo.
Ejemplo: Considere el siguiente ejemplo donde la celda A1 contiene datos mal escritos. Podemos corregir esto haciendo lo siguiente:
Paso 1: vaya a la pestaña Revisar y seleccione Ortografía
Seleccione los datos (A1) cuya ortografía desea comprobar. Vaya a la pestaña «Revisar», luego seleccione la opción «Ortografía». Esto le dará la ortografía correcta de esa palabra.
Paso 2: haga clic en la ortografía adecuada
El siguiente cuadro de diálogo aparecerá después de elegir Ortografía en la pestaña Revisar. Elija la ortografía adecuada para reemplazarla con la ortografía correcta.
Paso 3: vista previa del resultado
Conclusión
En conclusión, la limpieza de datos es un proceso indispensable y transformador en el campo de la gestión de datos. Sirve como base para análisis precisos, confiables y significativos, asegurando que los conjuntos de datos estén libres de errores, inconsistencias e imprecisiones. Al abordar cuestiones de integridad, coherencia y precisión, la limpieza de datos mejora la calidad general de la información, facilitando la toma de decisiones informadas en diversos ámbitos.
Preguntas frecuentes
1. ¿Cuáles son los mejores métodos para limpiar datos en Excel?
La verificación de errores, el formato condicional, la validación de datos, la revisión ortográfica, la administración de mayúsculas y minúsculas (superior/inferior/correcta), la administración de mayúsculas y minúsculas y la eliminación de duplicados son algunos de los mejores métodos para limpiar datos.
2. ¿Cómo puedo limpiar datos cuando trato con espacios adicionales en Excel?
EL PONER EN ORDEN la función se puede utilizar para eliminar espacios adicionales en datos de texto.
3. ¿Cómo puedo dividir datos de una sola columna en varias columnas en Excel?
Utilizar el «Texto en columnas» en la sección «Datos» para dividir columnas según delimitadores adecuados.
4. ¿Cuál es el propósito de la función «Buscar y reemplazar» en Excel?
EL «Encontrar y reemplazarLa función » se utiliza para localizar datos específicos en una hoja de trabajo y reemplazarlos con nuevos valores.
5. ¿Puedo utilizar la validación de datos para evitar que se ingresen valores no numéricos en una columna?
Respuesta: Sí, puedes. Al aplicar la validación de datos a una columna y elegir los criterios adecuados, puede evitar que los usuarios introduzcan valores no numéricos.