Maison >développement back-end >Tutoriel Python >méthode python pour normaliser les tableaux multidimensionnels

méthode python pour normaliser les tableaux multidimensionnels

不言
不言original
2018-04-09 11:38:109037parcourir

Le contenu de cet article est de partager avec vous la méthode de normalisation des tableaux multidimensionnels en python. Elle a une certaine valeur de référence. Les amis dans le besoin peuvent s'y référer

Aujourd'hui, j'ai rencontré un problème qui nécessite. normaliser des tableaux multidimensionnels. , mais beaucoup d'informations que j'ai vérifiées sur Internet sont une ligne ou une colonne d'un tableau normalisé. Il y a relativement peu d'informations sur la façon de normaliser un tableau multidimensionnel. Cependant, dans Tensorflow, il y a relativement peu d'informations sur la façon de normaliser un tableau multidimensionnel. les données dimensionnelles sont souvent nécessaires pour former les réseaux de neurones. Par conséquent, la normalisation des tableaux multidimensionnels est très nécessaire.

Après avoir consulté de nombreuses informations, j'ai découvert que le prétraitement dans la bibliothèque sklearn peut directement normaliser les tableaux multidimensionnels.

1. Utilisez la fonction sklearn.preprocessing.scale() pour standardiser les données données : la formule spécifique est (x - moyenne)/std. Sa signification est la suivante : soustrayez la moyenne de chaque colonne des données de cette colonne, puis divisez par l'écart type des données de cette colonne. Les données finales obtenues sont toutes proches de 0, avec une variance de 1. Des exemples de programmes spécifiques sont les suivants :

from sklearn import preprocessing

data_normal = preprocessing.scale(data)#data是多维数据

2. Utilisez la classe sklearn.preprocessing.StandardScaler. Cette classe peut calculer la moyenne et la variance de chaque colonne de données et convertir directement. la valeur originale basée sur la moyenne et la variance. Un exemple simple est le suivant :

from sklearn import preprocessing

#计算原始数据每行和每列的均值和方差,data是多维数据
scaler = preprocessing.StandardScaler().fit(data)
#得到每列的平均值,是一维数组
mean = scaler.mean_ 
#得到每列的标准差,是一维数组   
std = scaler.std_                                        
#标准化数据
data_nomal = scaler.transform(data)    
#可以直接使用训练集对测试集数据进行转换  
scaler.transform([[-1.,  1., 0.]])

3. La classe sklearn.preprocessing.MinMaxScaler met à l'échelle les données dans une plage spécifiée. Des exemples spécifiques sont les suivants :

from sklearn import preprocessing

min_max_scaler = preprocessing.MinMaxScaler()
#标准化训练集数据
data_train_nomal = min_max_scaler.fit_transform(data_train)
 
#对测试集数据进行相同的归一化处理
data_test_minmax = min_max_scaler.transform(data_test)
#获取缩放因子属性,结果是一维数组
min_max_scaler.scale_                             
min_max_scaler.min_

4. Ci-joint sklearn.preprocessing peut également effectuer une régularisation

(1) prétraitement . normalize() effectue une transformation de régularisation sur les données

data_normalized = preprocessing.normalize(data, norm='l2')

(2)preprocessing.Normalizer() ajuste d'abord les données, puis effectue une transformation de régularisation sur les données

normalizer = preprocessing.Normalizer().fit(data)  #拟合原始数据,data是多维数组
normalizer.transform(data) #正则化


Recommandations associées :

Comment convertir une chaîne python en un tableau bidimensionnel

Méthode Python diviser pour régner pour trouver la valeur maximale locale d'un tableau_python bidimensionnel



Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn