¿Cómo encontrar la media de un conjunto de columnas en una fila de una trama de datos pyspark y añadirlo como otra columna a la misma trama de datos?

votos
0

Tengo una trama de datos que consta de 500 columnas de los cuales, para cada fila que necesito para obtener el promedio del conjunto de columnas que comienzan con country_.

expr=[F.sum(train_data_df[x])/colCount for x in train_data_df.columns if 'country_' in x]
avg_train_data_df = train_data_df.withColumn('avg', *expr)

Me sale el siguiente error de respuesta:

TypeError: withColumn() takes 3 positional arguments but 212 were given

Publicado el 19/09/2018 a las 13:23
fuente por usuario
En otros idiomas...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more