KI Elemente

Viele Teile ergeben ein Ganzes! Die Kunst unwichtige Details zu vermeiden!

Kategorische Features

https://contrib.scikit-learn.org/category_encoders/

Diese Features liegen meist als Textdaten vor. Die einfachste Form ist das sogenannte "Label Encoding".

Beispiel: Sehr gut = 1, gut = 2 usw.

# Stuhlpfarrer Ehrenfried - 2021
# Demo Feature Engineering
# Import scikit-learn und pandas für Label Encoding
from sklearn import preprocessing
import pandas as pd

mitarbeiter_liste = {
'Mitarbeiter': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
'Verhalten': ["sehr gut", "gut", "gut", "befriedigend", "genügend", "nicht genügend", "sehr gut", "genügend", "gut", "gut" ],
'Haarfarbe': ["braun", "schwarz", "blond", "blau", "schwarz", "brünett", "rot", "braun", "schwarz", "schwarz"]
}

df = pd.DataFrame(mitarbeiter_liste, columns=['Mitarbeiter', 'Verhalten', 'Haarfarbe'])
print("DataFrame:", df)
lab_enc = preprocessing.LabelEncoder()
lab_enc.fit(df['Verhalten'])
trle = lab_enc.transform(df['Verhalten'])
print("Verhalten - Label zugeordnet: ", trle)
DataFrame:    Mitarbeiter       Verhalten Haarfarbe
0            1        sehr gut     braun
1            2             gut   schwarz
2            3             gut     blond
3            4    befriedigend      blau
4            5        genügend   schwarz
5            6  nicht genügend   brünett
6            7        sehr gut       rot
7            8        genügend     braun
8            9             gut   schwarz
9           10             gut   schwarz
Verhalten - Label zugeordnet:  [4 2 2 0 1 3 4 1 2 2]

KI

Copyright © 2021. All Rights Reserved. Ehrenfried Stuhlpfarrer