1 什么是機器學(xué)習(xí)
什么是機器學(xué)習(xí)?
這個問題不同的人員會有不同的理解。我個人覺得,用大白話來描述機器學(xué)習(xí),就是讓計算機能夠通過一定方式的學(xué)習(xí)和訓(xùn)練,選擇合適的模型,在遇到新輸入的數(shù)據(jù)時,可以找出有用的信息,并預(yù)測潛在的需求。最終反映的結(jié)果就是,好像計算機或者其他設(shè)備跟人類一樣具有智能化的特征,能夠快速識別和選擇有用的信息。
機器學(xué)習(xí)通常可以分為三個大的步驟,即 輸入、整合、輸出,可以用下圖來表示大致的意思:
2 機器學(xué)習(xí)示例(scikit-learn)
在python語言中,scikit-learn是一個開源的機器學(xué)習(xí)庫。下面以sklearn為例,來簡單描述機器學(xué)習(xí)的過程。
2.1 加載數(shù)據(jù)
通常第一步是獲取相關(guān)數(shù)據(jù),并進行相應(yīng)的處理,使之可以在后續(xù)過程中使用。
from sklearn import datasets
加載iris數(shù)據(jù)集并查看相關(guān)信息
# 加載數(shù)據(jù)集iris = datasets.load_iris()# print(iris)print(type(iris)) print(iris.keys())# 查看部分數(shù)據(jù)print(iris.data[ :5, :])# print(iris.data)
<class 'sklearn.datasets.base.Bunch'> dict_keys(['DESCR', 'data', 'feature_names', 'target', 'target_names']) [[ 5.1 3.5 1.4 &nb