Czy standaryzacja w segmentacji RFM ma znaczenie

ByMaki Pa 2024-05-222024-05-22

Zastanawiam się czy potrzebna jest standaryzacja danych, którą wykonuję w 108 linii kodu.

Kiedy rezygnuję z przeprowadzenia standaryzacji, wartości wcss na wykresie elbow sięgają wartości 8000. Kiedy przeprowadzana jest standaryzacja – 4000. Przebieg linii wykresu natomiast jest identyczny w obu przypadkach. Stąd moje pytanie, ponieważ na określenie optymalnej ilości klastrów standaryzacja w tym przypadku nie wpływa.

Nie jestem pewna na ile grup powinnam podzielić klientów na podstawie wykresu elbow. Im dłużej się nad tym zastanawiam, tym bardziej biorę pod uwagę podział na 4 grupy, ponieważ w tym punkcie występuje zgięcie się wykresu – “punkt łokcia”.

Ostatnią kwestią jest pytanie, czy potrzebuję wykresu punktowego na podstawie modelu TSNE. Szczerze mówiąc nie do końca rozumiem ten model.

Standaryzacja jest potrzebna do ogólnej poprawności obliczeń, bo inaczej np. będziesz miała money w zakresie 0-1000 a recency w zakresie 0-12, podobnie frequency, wiec trzeba to sięgnąć do tych samych zakresów. Może być tak, że 80% Monej jest w zakresie 0-1000 a tylko te kilka więcej to pokaż ten rozkład i przyjmij 1000 i więcej jako max wartość lub oblicz log(wartość sprzedaży) jako f.

Kalstry 4 lepsze niż 2, bo będzie jakieś większe rozbicie i to jest lepiej

TSNE to jest projekcja wyników wielowymiarowych na przestrzeń dwuwymiarową i zastępowanie kilku wymiarów jakimś wymiarem który je wszystkie reprezentuje łącznie – możesz ją pominąć, bo to już są większe komplikacje

Albo jedno, albo drugie, bo to jest to samo.

Czyli jeśli Ty sprowadzasz wartości R,F,M do przedziału <1-5>, i już w tym jakoś uwzględniasz niesymetrycznośc danych np., 5 zaczyna się od jakiejś wartości i obejmuje górne 20% próbek, qwartyl 4 – to wszystko jest o.k. i twoja analiza zawiera standaryzację

Oczywiście drugie podejście jest sprowadzanie danych do 0-1 algorytmem standard_scaller z sk-learn, ale 1-5 jest o.k., bo to jest analiza biznesowa.

Standaryzacja ma znaczenie, jeśli klastrujesz od razu na podstawie wszystkich wymiarów R, F, M, jak tutaj https://mateuszgrzyb.pl/segmentacja-behawioralna-klientow-rfm/ – czytaj od 7.2

Tutaj masz przykład innego podejścia – czyli policzenia każdej ze zmiennych oddzielnie – czytaj od Step 3/4: Clustering Customers – i to podejście chyba biznesowo jest lepsze, i tutaj nie trzeba standaryzacji po po prostu dzielisz na cztery grupy te wartości – i można to zrobić bez tego algorytmu 😊.

https://medium.com/@luke.smalley_3613/a-beginners-guide-to-performing-rfm-analysis-with-python-37c6ebbc67d7

Ale jak zrobisz tak będzie dobrze.

Tutaj jest trochę więcej opisu i skorzystaj z tych opisów w swojej pracy.

https://medium.com/@melodyyip_/rfm-customer-segmentation-using-python-1a1865c6e7cb

Owocnego klastrowania Mieczysław Pawłowski

Customer Experience Management

Sustainability and Sustainable Development
ByMaki Pa 2022-12-012022-12-01

Sustainability Sustainability and sustainable development are two terms that are often used interchangeably but their roots are different. The term sustainability originated from ecology and referred to managing natural resources in a way that the desired level of environmental quality is maintained (Eggert, 2009; Ihlen & Roper, 2014). One of the most well-known applications of…

Read More Sustainability and Sustainable Development
Customer Experience Management

10 Reasons Why Erasmus Should Study at UMCS Lublin with success
ByMaki Pa 2024-11-062024-12-02

10 Reasons Why Erasmus Should study at UMCS Lublin are easy application procedure, different courses, opportunities for study together with people from all the world, new cultures, interesting country and people around, improved language skills and personal development. Why Choose Lublin for Your Studies? Lublin is a popular choice for students from around the world…

Read More 10 Reasons Why Erasmus Should Study at UMCS Lublin with success
Customer Experience Management

Marketing for multichannel retail
ByMaki Pa 2024-05-192024-05-19

Logistyka welokanałowa – tematy na prezentacje

Read More Marketing for multichannel retail
Customer Experience Management

Strategies for customer retention
ByMaki Pa 2024-01-212025-06-25

This changing landscape from brick and mortar approach to E-commerce is a kind of challenge for the firms to maintain the level of satisfaction of customers and at the same time augment Customer Experience (CE) (Bhattacharya & Sharma, 2022). CE in the context of digital Marketing is now considered a key variable of interest in…

Read More Strategies for customer retention
Customer Experience Management

Projektowanie wnętrz – rynek w Lublinie
ByMaki Pa 2026-06-172026-06-17

Projektowanie wnętrz w Lublinie – rozumiem, że zastanawiasz się nad wejściem w branżę . To świetny moment na taką analizę — rynek w połowie 2026 roku jest bardzo aktywny, ale wymaga od nowych graczy przemyślanej strategii. Minęły już czasy, gdy wystarczyło po prostu “otworzyć biuro”, aby klienci sami się pojawili. Oto konkretne dane i wnioski,…

Read More Projektowanie wnętrz – rynek w Lublinie
Customer Experience Management

Discovering the University of Cantabria
ByErasmus Students 2024-11-272025-01-26

My name is Rubén Gómez Segura, and I study at the University of Cantabria, a public university located in the autonomous community of Cantabria, Spain. It has fifteen centers distributed across three campuses: one in Santander, another in Torrelavega, and a third in Comillas. These centers, includes faculties, schools, and affiliated centers, as follows: Faculties:…

Read More Discovering the University of Cantabria

Similar Posts