Skip to main content

Dlaczego Excel nie jest bazą danych

By 9 marca, 20214 marca, 2022Integracja i przetwarzanie danych
Excel to nie baza danych

Arkusze kalkulacyjne wyglądają niekiedy podobnie jak bazy danych. Osoby, które nie używają rozwiązań bazodanowych na co dzień, mogą na pierwszy rzut oka nie odróżnić ich od zwykłego Excela. Prawda jest jednak taka, że są to dwa różne narzędzia z zupełnie innymi funkcjonalnościami. Przechowywanie danych w Excelu może wiązać się ze sporym ryzykiem, a praca z tym formatem bywa frustrująca. Dowiedz się, jak uniknąć największych koszmarów z Excelem w roli głównej.

No i stało się – pod koniec 2020 roku służba zdrowia w Wielkiej Brytanii straciła 16 000 wyników testów na COVID-19. Winę za to przypisano programowi MS Excel. Stało się tak, choć na rynku dostępny jest spory wybór różnych baz danych. Mimo to wiele instytucji i firm wciąż przechowuje dane właśnie w plikach Excela.

To zaledwie jeden z wielu spektakularnych przykładów utraty informacji z arkuszy kalkulacyjnych. Jeśli jednak przeanalizujemy własne doświadczenia, z pewnością każdy z nas przypomni sobie podobną sytuację. Należy jednak powiedzieć jasno: przechowywanie wrażliwych informacji w Excelu w ekstremalnych sytuacjach może skutkować nawet zagrożeniem dla ludzkiego życia.

Dlaczego mimo to tak wiele firm przechowuje dane w Excelu?

Dzieje się tak nie bez powodu. Excel to po prostu bardzo popularne narzędzie – jest znany, elastyczny, jesteśmy do niego przyzwyczajeni. Można w nim łatwo wykonać proste obliczenia czy diagramy. Dzięki możliwości integracji z Sharepointem może się też łatwo stać środowiskiem pracy dla wielu użytkowników jednocześnie. Przy wszystkich tych zaletach, Excel ma jednak pewne ograniczenia. Niektóre wynikają z wewnętrznych błędów technicznych programu. Takie właśnie błędy stały się przyczyną wspomnianej wyżej sytuacji z Wielkiej Brytanii. Przyczyną utraty wyników testów na COVID-19 było załadowanie do Excela większej liczby linijek z pliku tekstowego niż program był w stanie przyjąć. O tym, że może to spowodować błąd programu, na pewno wiedzą doświadczeni, świadomi użytkownicy Excela. Większość z nas jednak zna program pobieżnie, a nawet ci bardziej biegli popełniają błędy z powodu pośpiechu czy jakiejś podbramkowej sytuacji. Zdarza się, że użytkownicy starają się obejść ograniczenia Excela, na przykład poprzez podzielenie pliku na kilka oddzielnych arkuszy.

Czym jest zatem „prawdziwa” baza danych?

Wiemy już, że traktowanie Excela jak bazy danych to zły pomysł zwłaszcza wtedy, gdy Twoja baza liczy sobie więcej niż milion rekordów i zawiera informacje dotyczące statystyk zdrowotnych. Jednak odmienne podejście nie dziwi – jeśli użytkownik wcześniej nie pracował z rozwiązaniami bazodanowymi, nie wie, jak wyglądają, a arkusz kalkulacyjny wydaje się łudząco podobny. Jednak pod pojęciem bazy danych rozumiemy systemy takie jak PostgreSQL, SQL Server, Oracle, czy nawet lżejsze rozwiązania, jak SQLite. Zostały one zaprojektowane z myślą o przechowywaniu dużej ilości informacji i ich integrowaniu. Co prawda załadowanie prawdziwej bazy danymi może być pracochłonne – istnieje więc wiele różnych sposobów na ich zaimportowanie. Wyzwaniem może być też oczywiście automatyzowanie aktualizacji bazy.

Excel i bazy danych mogą działać razem

Jest wiele dobrych, efektywnych sposobów na konfigurację automatycznych procesów w bazach danych. Najlepszym rozwiązaniem jest używanie odpowiednich narzędzi, a Excel może być jednym z nich. Przykład takiego podejścia znajdziemy w Europejskiej Agencji Środowiska (European Environment Agency, EEA), która pracuje w ten sposób od wielu lat. Zadaniem agencji jest monitorowanie stanu środowiska naturalnego, a co za tym idzie – gromadzenie ogromnej ilości danych, np. informacji pomiarowych o smogu w Europie. Doświadczeniem w tym zakresie dzieli się Jan Bliki, pełniący funkcję Head of the Group on Data Management w EEA:

– Excel to wciąż najłatwiejsze narzędzie do wprowadzania danych dla osób, które nie znają rozwiązań bazodanowych. Ciężko jest zastąpić czymś innym program, do którego użytkownicy są tak przyzwyczajeni. W Agencji prosimy więc o przesyłanie nam danych w postaci kilku plików z użyciem takiego samego szablonu – pliki Excel, które zawierają jedynie część danych (na przykład według nazwy placówki i daty). Następnie używamy centralnej usługi, która łączy wyniki w jedną bazę danych za pomocą jednego narzędzia ETL. Aby łatwo było korzystać z takiej bazy danych, możemy podłączyć narzędzie klasy Business Intelligence, aby ci sami użytkownicy mogli uzyskać przegląd wyników.

Warto zwrócić uwagę na powyższe rozwiązanie.

Mamy tu:

  1. Bazę, która pomaga zachować integralność danych.
  2. Automatyzację, zapewnioną przez narzędzie ETL (takie jak np. FME), które może też zadbać o jakość danych. Narzędzia takie mogą wysyłać alerty w przypadku podejrzanych aktywności, ale także sprawiają, że łatwo jest zachować aktualność bazy danych.
  3. Natomiast użycie narzędzia BI wraz z bazą danych to świetny sposób na zapewnienie użytkownikom informacji zwrotnej.

Jak narzędzie ETL – na przykład FME – sprawdza poprawność danych oraz QA w takim procesie? Wyobraź sobie, że baza danych to zabezpieczona kasa pancerna. Aby włożyć (a także wyjąć) dane, muszą one posiadać odpowiednie właściwości. FME to system bezpieczeństwa, który sprawdza, czy Twoje dane mają te właściwości oraz informuje o wykrytych nieprawidłowościach.

Jakie mogą to być właściwości?

  • Czy w arkuszu Excela nie znajduje się więcej niż określona liczba rzędów? Sprawdzenie tego mogłoby zapobiec wspomnianej wcześniej sytuacji z testami na COVID-19.
  • Czy jakieś wyniki są zduplikowane?
  • Czy wartości danych mieszczą się w sensownych przedziałach?
  • Czy wszystkie pola mają wartości?

…i wiele, wiele więcej. Jedną z największych korzyści zautomatyzowanego procesu jest możliwość dodawania kolejnych wymagań wraz z rozwojem bazy i ciągłego wzmacniania bezpieczeństwa systemu.

Narzędzia nie są winne

Narzędzia to tylko narzędzia. Obarczanie arkuszy kalkulacyjnych winą za wypadki do niczego nie prowadzi – to tylko Excel został użyty w niewłaściwy sposób. Ważne jest natomiast, aby każdy dysponent danych był ostrożny i dbał o ich zabezpieczenie.

Masz dodatkowe pytania na temat Excela i FME? Skontaktuj się z nami! Zachęcamy również do obejrzenia webinaru „Ask me Anything About Excel Integration”, prowadzonego przez Dona i Dale’a, współzałożycieli Safe Software.

Tekst na podstawie artykułu Ulfa Månssona z firmy SWECO, specjalisty dobrze znanego w międzynarodowej społeczności FME. Artykuł pierwotnie opublikowany na stronie Safe Software. Z oryginałem możesz zapoznać się tutaj.

fme_logo_small

Twórcy FME, kanadyjska firma Safe Software stara się stale podążać na trendami w dziedzinie integracji danych. W związku z tym, platforma FME jest często aktualizowana, co pozwala na obsługę coraz to nowych lub zaktualizowanych formatów danych lub pracę z dużą ilością danych. Kolejne wersje platformy FME będą jeszcze bardziej stawiały na automatyzację i integrację danych.

Już dziś możesz pobrać FME i przez 30 dni bezpłatnie testować możliwości tego narzędzia!

Wypróbuj FME