Czyszczenie danych w Excelu: SUPPRESPACE, SUBSTITUE, NETTOYER i dobre praktyki

Evaluez cet article !
[Total: 0 Moyenne : 0]


Oczyszczanie danych w Excelu: SUPPRESPACE, SUBSTITUE, NETTOYER i dobre praktyki

Utrzymanie czystych danych w Excelu to nie tylko kwestia estetyki: to warunek wiarygodnych obliczeń, poprawnych łączeń i użytecznych tabel. Między niewidzialnymi spacjami, znakami nie drukowalnymi, błędami wielkości liter a źle umieszczonymi separatorami, importowane pliki często są minowym polem. Tutaj pokazuję krok po kroku, jak wykrywać te pułapki i je poprawiać za pomocą prostych formuł, nowoczesnych trików i narzędzia Power Query, gdy zestawy danych stają się poważne.

W skrócie

🧹 SUPPRESPACE usuwa zbędne spacje (spacje na początku/końcu i podwójne spacje), ale nie rozwiązuje wszystkich przypadków: spacje nierozdzielające (ZNAK 160) lub niektóre znaki nie drukowalne pozostają i wymagają połączenia z SUBSTITUE lub NETTOYER.

🔁 SUBSTITUE zastępuje ciąg znaków innym, nie zwracając uwagi na wielkość liter. Aby usunąć konkretne znaki (np. średniki lub myślniki), jest to często najprostsze rozwiązanie.

⚙️ Przy dużych wolumenach lub powtarzających się transformacjach, preferuj Power Query: interfejs wizualny, historia kroków i lepsza wydajność na długich tabelach.

🧩 W nowszym Excelu zaawansowane funkcje (np. REGEXREPLACE, TEXTSPLIT) upraszczają skomplikowane przypadki, ale klasyczne techniki pozostają niezbędne, aby zapewnić przenośność i zrozumiałość arkuszy.

Dlaczego oczyszczać dane?

Niechlujny arkusz kalkulacyjny daje mylące wyniki: sumy odbiegające od prawdy, niemożliwe wyszukiwania za pomocą WYSZUKAJ.PIONOWO lub INDEKS/PODAJ.POZYCJĘ oraz tabele przestawne liczące więcej wierszy niż powinny. Częstymi przyczynami są nieoczekiwane spacje, ukryte znaki powrotu karetki, znaki skopiowane z internetu lub formaty liczb przechowywane jako tekst. Oczyszczanie nie polega na ręcznym „poprawianiu” wszystkich wartości, lecz na zastosowaniu serii powtarzalnych operacji, które czynią plik wiarygodnym i audytowalnym.

Podstawowe funkcje do poznania

SUPPRESPACE (TRIM)

SUPPRESPACE usuwa spacje na początku i końcu ciągu oraz zastępuje wielokrotne spacje pojedynczą. Przykład użycia: =SUPPRESPACE(A2). To często pierwszy krok, ponieważ normalizuje odstępy między słowami. Uwaga: SUPPRESPACE nie usuwa koniecznie niestandardowych spacji (np. spacji nierozdzielającej) ani znaków nie drukowalnych.

SUBSTITUE (SUBSTITUTE)

SUBSTITUE zastępuje podciąg innym, nie zwracając uwagi na wielkość liter. To narzędzie pierwszego wyboru do usuwania konkretnych znaków: =SUBSTITUE(A2;”,”;””) usuwa wszystkie przecinki. Aby usunąć spację nierozdzielającą (ZNAK 160), łączymy: =SUPPRESPACE(SUBSTITUE(A2;ZNAK(160);” „)). Logika jest prosta: najpierw zastępujemy problematyczną wartość standardową spacją, a potem normalizujemy spacje.

NETTOYER (CLEAN)

NETTOYER usuwa znaki nie drukowalne (często pochodzące z transferów z systemów lub internetu). Jeśli twoja komórka wyświetla kwadraty lub powoduje niechciane powroty karetki, NETTOYER jest dobrym odruchem: =NETTOYER(A2). Używany w połączeniu z SUPPRESPACE daje znacznie czystszy wynik.

MAJUSCULE, MINUSCULE, NOMPROPRE

Ujednolicenie wielkości liter poprawia czytelność i zapobiega pozornym duplikatom. MAJUSCULE zamienia wszystko na wielkie litery, MINUSCULE na małe, NOMPROPRE zmienia pierwszą literę każdego słowa na wielką. Przykłady: =MAJUSCULE(A2) lub =NOMPROPRE(A2). Te transformacje są niezbędne przed porównywaniem ciągów znaków.

Praktyczne formuły i przykłady

Oto formuły, które możesz wkleić i dostosować. Proponuję także logikę kolejności działań: usuwanie niewidocznych znaków → zamiana uciążliwych znaków → normalizacja spacji → dostosowanie wielkości liter.

Cel Formuła (fr) Oczekiwany rezultat
Usunięcie powrotów karetki i tabulacji =NETTOYER(A2) Tekst bez znaków nie drukowalnych
Zamiana spacji nierozdzielającej (ZNAK 160) =SUBSTITUE(A2;CAR(160);” „) Standardowe spacje
Połączenie czyszczenia i trim =SUPPRESPACE(NETTOYER(SUBSTITUE(A2;CAR(160);” „))) Czysty tekst z poprawną ilością spacji
Usunięcie konkretnego znaku =SUBSTITUE(A2;”-„;””) Usuwa wszystkie myślniki
Ujednolicenie wielkości liter =NOMPROPRE(SUPPRESPACE(A2)) Ustandaryzowana nazwa własna

Praktyczny przypadek: czyszczenie kolumny „Adres”

Załóżmy, że kolumna zawiera adresy importowane z CRM, które mają spacje nierozdzielające i powroty karetki. Poniższa formuła stosuje kolejno poprawki:

=SUPPRESPACE(NETTOYER(SUBSTITUE(C2;CAR(160);” „)))

Zaczynamy od zamiany ZNAK(160) na spacje, następnie NETTOYER usuwa znaki niewidoczne, a na końcu SUPPRESPACE standaryzuje spacje. Wynik: adres gotowy do sortowania i scalania.

Zaawansowane techniki i nowoczesny Excel

Jeśli pracujesz z Microsoft 365 lub nowszą wersją, nowe funkcje przyspieszają czyszczenie. REGEXREPLACE pozwala usuwać złożone wzorce (np. usuwanie wszystkich znaków interpunkcyjnych). TEXTSPLIT i TEXTJOIN ułatwiają ponowne składanie po rozdzieleniu. Ale dwie uwagi: 1) nie wszystkie organizacje mają te wersje, 2) solidność klasycznych formuł jest nadal przydatna dla przenośności.

Zamiana powtarzających się wzorców

Bez REGEX można zagnieździć SUBSTITUE, aby usunąć kilka różnych znaków. Przykład:

  • =SUBSTITUE(SUBSTITUE(SUBSTITUE(A2;”.”;””);”,”;””);”;”;””) usuwa kropki, przecinki i średniki.
  • Jeśli masz REGEXREPLACE: =REGEXREPLACE(A2;”[[:punct:]]”;””) jest bardziej eleganckie (w zależności od dostępności).

Power Query: kiedy go używać

Power Query (Pobierz i przekształć dane) to narzędzie odpowiednie, gdy przetwarzasz duże pliki lub regularne importy. Interfejs oferuje gotowe operacje: konwersja na typ tekstowy, usuwanie spacji, zamiana wartości, dzielenie kolumn, zastosowanie akcji na wielu kolumnach jednocześnie. Każdy krok jest zapisywany i może być automatycznie powtórzony podczas aktualizacji danych.

  • Częste kroki: Usuwanie pustych wierszy, konwersja typów, zamiana wartości, usuwanie spacji i czyszczenie kolumn.
  • Zaleta: śledzenie — widzisz listę kroków i możesz cofnąć zmiany.
  • Wada: lekka krzywa uczenia się przy pisaniu własnych transformacji (język M).

Prosty przykład w Power Query

Importuj CSV → Kliknij kolumnę → Przekształcenia → Usuń spacje → Zamień wartości → Zamknij i załaduj. Operacje stają się powtarzalne i eliminują błędy ręczne.

Workflow czyszczenia danych w Excelu: formuły i Power Query

Dobre praktyki i lista kontrolna

Przed zastosowaniem nieodwracalnych transformacji zalecam:

  • Pracę na kopii oryginalnych danych.
  • Dokumentowanie kroków (arkusz „README” lub komentarze w skoroszycie).
  • Stosowanie transformacji w sposób odwracalny: używanie kolumn pomocniczych zamiast nadpisywania.
  • Weryfikację próbki na każdym etapie, aby uniknąć wprowadzenia błędów (np. usunięcie znaku „-”, który był częścią kodu).

Tabela szybkich odniesień

Problem Narzędzia/formuła Uwagi
Zbyt wiele spacji SUPPRESPACE Połącz z SUBSTITUE dla CAR(160)
Niewidoczne znaki NETTOYER Idealne dla znaków powrotu karetki i tabulacji
Zamiana znaku SUBSTITUE Nie zmienia wielkości liter
Powtarzające się operacje / duże wolumeny Power Query Trwalsze i bardziej śledzone niż kolumny formuł

Wskazówki, jak unikać pułapek

Mogłoby się wydawać, że jedna formuła rozwiązuje wszystko, ale w rzeczywistości każde źródło ma swoje specyfiki. Kopiowanie ze strony internetowej → uwaga na encje HTML, eksport CSV z oprogramowania → uwaga na lokalne separatory, import z systemu księgowego → uwaga na formaty liczb przechowywane jako tekst. Testuj na podzbiorze, a następnie automatyzuj za pomocą Power Query lub makr, jeśli to konieczne.

FAQ

Czy SUPPRESPACE usuwa wszystkie niewidoczne spacje?

Nie. SUPPRESPACE obsługuje zwykłe spacje i wielokrotne spacje, ale niektóre znaki, takie jak spacja nierozdzielająca (CAR 160) lub inne znaki nie drukowalne mogą pozostać. Wtedy używa się SUBSTITUE i/lub NETTOYER jako uzupełnienie.

Co zrobić, jeśli moje liczby są przechowywane jako tekst?

Użyj VALEUR, aby przekonwertować na liczbę, lub w Power Query zmień typ na Liczba. Uważaj na lokalne separatory dziesiętne (przecinek vs kropka) podczas konwersji.

Czy REGEX jest lepszy niż SUBSTITUE?

REGEX jest potężniejszy dla złożonych wzorców, ale nie jest dostępny wszędzie. Aby zapewnić przenośność i zrozumiałość, SUBSTITUE i klasyczne formuły pozostają dobrym kompromisem.

Czy Power Query całkowicie zastępuje formuły?

Power Query jest często preferowany do początkowego pobierania i przekształcania danych. Formuły pozostają przydatne do dynamicznych obliczeń w arkuszu. Oba podejścia się uzupełniają.

Evaluez cet article !
[Total: 0 Moyenne : 0]
Lire aussi  Importowanie pliku CSV do Excela i naprawa częstych błędów
Julie - auteure Com-Strategie.fr

Julie – Auteure & Fondatrice

Étudiante en journalisme et passionnée de technologie, Julie partage ses découvertes autour de l’IA, du SEO et du marketing digital. Sa mission : rendre la veille technologique accessible et proposer des tutoriels pratiques pour le quotidien numérique.

Dodaj komentarz