對(duì)于想深入了解線性回歸的童鞋,這里給出一個(gè)完整的例子,詳細(xì)學(xué)完這個(gè)例子,對(duì)用scikit-learn來(lái)運(yùn)行線性回歸,評(píng)估模型不會(huì)有什么問(wèn)題了。
1. 獲取數(shù)據(jù),定義問(wèn)題
沒(méi)有數(shù)據(jù),當(dāng)然沒(méi)法研究機(jī)器學(xué)習(xí)啦。:) 這里我們用UCI大學(xué)公開的機(jī)器學(xué)習(xí)數(shù)據(jù)來(lái)跑線性回歸。
數(shù)據(jù)的介紹在這: http://archive.ics.uci.edu/ml/datasets/Combined+Cycle+Power+Plant
數(shù)據(jù)的下載地址在這: http://archive.ics.uci.edu/ml/machine-learning-databases/00294/
里面是一個(gè)循環(huán)發(fā)電場(chǎng)的數(shù)據(jù),共有9568個(gè)樣本數(shù)據(jù),每個(gè)數(shù)據(jù)有5列,分別是:AT(溫度), V(壓力), AP(濕度), RH(壓強(qiáng)), PE(輸出電力)。我們不用糾結(jié)于每項(xiàng)具體的意思。
我們的問(wèn)題是得到一個(gè)線性的關(guān)系,對(duì)應(yīng)PE是樣本輸出,而AT/V/AP/RH這4個(gè)是樣本特征, 機(jī)器學(xué)習(xí)的目的就是得到一個(gè)線性回歸模型,即:
延伸閱讀
學(xué)習(xí)是年輕人改變自己的最好方式