Taula de continguts:

Per què deixar primer els maniquís?
Per què deixar primer els maniquís?
Anonim

Resposta

1. drop_first=True és important d'utilitzar, ja que ajuda a reduir la columna addicional creada durant la creació de variables simulades. Per tant, redueix les correlacions creades entre les variables simulades.

Per què ens posem primer als maniquís?

És possible eliminar la vostra primera variable categòrica perquè si totes les altres columnes simulades són 0, això significa que el vostre primer valor hauria estat 1. El que elimineu en redundància, obtindreu confusió.

Què fan els maniquís de PD?

get_dummies s'utilitza per a la manipulació de dades. Converteix les dades categòriques en variables simulades o indicadores.

Per què fem servir Get_dummies a Python?

La funció get_dummies s'utilitza per convertir variables categòriques en variables simulades/indicadores. Dades de les quals obtenir indicadors ficticis. Cadena per afegir noms de columnes DataFrame.

Quina diferència hi ha entre OneHotEncoder i Get_dummies?

OneHotEncoder és una funció de preprocessament sklearn. A diferència de get_dummies, OHE no afegeix variables al vostre marc de dades Crea variables simulades transformant X, i totes les maniquís s'emmagatzemen a X. I podeu especificar quines columnes voleu crear maniquís. quan encaixes X per OHE.

Recomanat: