La categorización de los datos utilizando los pandas

votos
1

introducir descripción de la imagen que aquí estoy tratando de ejecutar una prueba de chi cuadrado en un conjunto de datos y para eso necesito utilizar pd.cut()para formular categorías en el conjunto de datos. Sin embargo, yo estoy recibiendo este error

ufunc 'reste' no contiene un bucle con la firma búsqueda de tipos dtype ('

Mi código:

import pandas as pd
import numpy as np
import scipy as sp
import math

data_main = pd.read_csv(sample_survey.csv)
data = data_main.iloc[:, [1,2]]

data[wrkstat] = data[wrkstat].astype(str)
data[marital] = data[marital].astype(str)
cols = ['wrkstat', 'marital']

cut_points = ['Divorced', 'Married', 'Never Married', 'Seperated','Widowed']
label_names = ['Divorced1', 'Married', 'Never Married', 
'Seperated','Widowed']
data[Marital_Categories] = pd.cut(data[marital], cut_points)

marital_by_wrkstat = data[['wrkstat', 'marital_categories']]
marital_by_wrkstat.head()
Publicado el 20/10/2018 a las 10:48
fuente por usuario
En otros idiomas...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more