Wizualizacja danych w Pythonie – Matplotlib
Matplotlib jest to jedna z najpopularniejszych bibliotek, która służy do tworzenia wizualizacji danych w Pythonie. Matplotlib została stworzona przez Johna D. Huntera w 2003 roku jako otwartoźródłowa biblioteka umożliwiająca tworzenie statycznych, animowanych i interaktywnych wykresów w Pythonie. Biblioteka jest wydawana na licencji BSD, co oznacza, że jest darmowa i można jej używać zarówno w projektach komercyjnych, jak i naukowych.
Autor artykułu: Patryk Kot, 22.01,2025
Dzięki modułowi pyplot oraz funkcjom takim jak: plot(), title(), xlabel() i ylabel() możliwe jest wykonanie wykresów o różnym stopniu zaawansowania od podstawowych wykresów liniowych po skomplikowane wizualizację 3D. W tym blogu skupię się na przedstawieniu najważniejszych funkcji oraz zastosowań Matplotlib’u. Ponadto wykorzystam elementy kodu, aby w praktyce pokazać zastosowanie tej biblioteki.
Matplotlib – podstawowa biblioteka w pracy analityka danych w Pythonie.
Biblioteka Matplotlib oferuje możliwość tworzenia różnego typu wykresów, do których można zaliczyć między innymi:
- Wykres liniowy,
- Wykres słupkowy,
- Wykres kołowy,
- Wizualizację 3D,
- Histogram,
- Heatmapy,
- Wykres punktowy.
(Poniżej przedstawiam typy wykresów z opisami, fragmentem kodu oraz fikcyjnymi danymi sprzedażowymi dla firmy X z podziałem na kategorie lub lata. Dane te będą potrzebne do stworzenia wizualizacji).
- Wykres liniowy, który idealny jest do przedstawienia zmienności danych w czasie

Na początku należy zaimportować bibliotekę matplotlib.pyplot oraz zdefiniować zmienne, które chcemy użyć w naszej wizualizacji. Następnie tworzymy wykres zaczynając od wymiarów po opisanie osi oraz dodanie niezbędnego formatowania. Efekt finalny przedstawia się poniżej.

- Wykres słupkowy, zazwyczaj używany do porównania danych z podziałem na kategorie. Przedstawię teraz te same dane w postaci wykresu słupkowego. Dla urozmaicenia zmienię kolor z niebieskiego na zielony.


- Wykresy kołowe użyteczne w przypadku przedstawienia udziałów procentowych.


Ponadto biblioteka Matplotlib oferuje wiele opcji stylizacji dla wizualizacji, które pozwalają dostosować wykres do indywidualnych potrzeb oraz preferencji. Do takich modyfikacji stylu należą:
- Zmiana kolorów,
- Stylów linii,
- Grubości linii,
- Zmiana czcionki,
- Dodanie lub usunięcie siatki.
Jak wspomniałem w tytule, biblioteka Matplotlib jest podstawowym narzędziem analityków, ponieważ znajduje ona swoje zastosowanie w eksploracyjnej analizie danych, umożliwiając szybką i prostą wizualizację wzorców czy trendów. Zaawansowana możliwość edycji sprawia, że biblioteka ta używana jest to tworzenia wysokiej jakości wizualizacji, które później używane są w raportach czy prezentacjach.
