AI Artificial Intelligence

Viele Teile ergeben ein Ganzes! Die Kunst unwichtige Details zu vermeiden!

Quantil Binning

Beim Binnig gibt es eine fixe Aufteilung der Zahlenbereiche. Das Quantil-Binning greift auf die Häufigkeit des Vorkommens zurück.

Ein 10-teiliges Binning ist ein Percentil - Binning.

Im ersten Teil werden die ersten 10% aller vorkommenden Daten zusammengefasst. Im zweiten Teil werden die zweiten 10% zusammengefasst und so weiter.

# Stuhlpfarrer Ehrenfried - 2021
# Demo Feature Engineering - One Hot Encoding
# Import scikit-learn und pandas für Label Encoding

import numpy as np
import pandas as pd

# Beliebige Zahlen generieren
zufaelligeElemente = np.random.randint(0, 500, 50)
print("Die zufälligen Zahlen: ", zufaelligeElemente)

# Bestimmung der Perzentil-Grenzen mit pandas qcut
percentilGrenzen = pd.qcut(zufaelligeElemente, 10)
print("Perzentil Grenzen: ", percentilGrenzen)
Das Ergebnis:
Die zufälligen Zahlen:  [ 23 400 229 324 492 401 254 258  67 292 392 425 134 332 257 421 411 375
  11 490 434 204  75 164 227 458 480 439 296 449  22 428 455 235 252  62
 264 383 491 245 345 403 376 310  73 293 261   9 391 485]
Perzentil Grenzen:  [(8.999, 66.5], (378.8, 401.6], (196.0, 249.9], (317.0, 378.8], (460.2, 492.0], ..., (262.8, 317.0], (249.9, 262.8], (8.999, 66.5], (378.8, 401.6], (460.2, 492.0]]
Length: 50
Categories (10, interval[float64]): [(8.999, 66.5] < (66.5, 196.0] < (196.0, 249.9] < (249.9, 262.8] <
                                     ... < (378.8, 401.6] < (401.6, 429.2] <
                                     (429.2, 460.2] < (460.2, 492.0]]

KI

Copyright © 2022. All Rights Reserved. Ehrenfried Stuhlpfarrer