Binning
Beim Binning werden numerische Werte in Kategorien umgewandelt.
Zweck:
Wenn der einzelne Wert für eine Aussage zu genau ist, dann kann man damit die Werte in beliebige Klassen einteilen:
Datei: BesonderheitenMitZahlen.py
# Stuhlpfarrer Ehrenfried - 2021
# Demo Feature Engineering - Binning
# Import scikit-learn und pandas für Label Encoding
import numpy as np
import matplotlib.pyplot as plt
# Erzeuge 200 zufällige Messwerte zwischen 0 und 1000
zaehler = np.random.randint(0, 1000, 200)
print("Messwerte: ", zaehler)
# Die Zahlenwerte verschiedenen Bereichen (Bins) zuordnen
# Im 100er Abstand
np.floor_divide(zaehler, 100)
# Die Ausgabe als Grafik
plt.hist(zaehler, bins = 100)
plt.ylabel('Frequenz')
plt.xlabel('Messwerte')
plt.show()
Messwerte: [194 430 136 87 320 162 487 892 468 630 419 52 783 868 709 458 947 858 390 565 53 455 429 742 96 781 890 947 987 613 248 974 95 505 71 332 228 382 132 958 507 849 472 922 720 153 322 813 356 300 396 591 230 861 835 907 449 430 260 753 543 455 909 145 292 953 144 545 665 851 909 103 914 937 995 555 530 637 669 952 461 32 987 283 891 155 209 153 401 102 663 161 501 196 935 697 748 645 143 348 807 922 363 413 381 89 25 497 577 700 949 220 171 407 440 718 690 909 897 828 867 388 883 669 973 645 361 651 660 388 534 420 956 917 448 990 47 195 828 271 788 899 755 630 195 70 540 260 932 188 908 214 649 392 217 391 78 907 370 958 983 271 949 421 409 991 17 930 171 112 575 157 556 123 975 658 238 673 456 381 741 401 31 227 388 158 905 9 905 868 73 611 158 872 897 51 132 583 718 302]