1樓:威震天黑黑
邏輯迴歸通常用於解決分類問題,「分類」是應用邏輯迴歸的目的和結果,但中間過程依舊是「迴歸」。
邏輯迴歸是用來做分類演算法的,大家都熟悉線性迴歸,一般形式是y=ax+b,y的取值範圍是[-∞有這麼多取值,怎麼進行分類呢?不用擔心,偉大的數學家已經為我們找到了乙個方法。
也就是把y的結果帶入乙個非線性變換的sigmoid函式中,即可得到[0,1]之間取值範圍的數s,s可以把它看成是乙個概率值,如果我們設定概率閾值為,那麼s大於可以看成是正樣本,小於看成是負樣本,就可以進行分類函式中t無論取什麼值,其結果都在[0,-1]的區間內,回想一下,乙個分類問題就有兩種答案,一種是「是」,一種是「否」,那0對應著「否」,1對應著「是」,那又有人問了,你這不是[0,1]的區間嗎,怎麼會只有0和1呢?這個問題問得好,我們假設分類的閾值是,那麼超過的歸為1分類,低於的歸為0分類,閾值是可以自己設定的。
函式中t無論取什麼值,其結果都在[0,-1]的區間內,回想一下,乙個分類問題就有兩種答案,一種是「是」,一種是「否」,那0對應著「否」,1對應著「是」,那又有人問了,你這不是[0,1]的區間嗎,怎麼會只有0和1呢?這個問題問得好,我們假設分類的閾值是,那麼超過的歸為1分類,低於的歸為0分類,閾值是可以自己設定的。
好了,接下來我們把ax+b帶入t中就得到了我們的邏輯迴歸的一般模型方程:
結果p也可以理解為概率,換句話說概率大於的屬於1分類,概率小於的屬於0分類,這就達到了分類的目的。
邏輯迴歸有什麼優點。
lr能以概率的形式輸出結果,而非只是0,1判定。
lr的可解釋性強,可控度高(你要給老闆講的嘛…)。
訓練快,feature engineering之後效果贊。
因為結果是概率,可以做ranking model。
邏輯迴歸有哪些應用。
ctr預估/推薦系統的learning to rank/各種分類場景。
某電商的購物搭配推薦用了大量lr。
2樓:小世界
所謂的邏輯迴歸其實就是逆向思維,就是對於乙個問題邏輯可以正向推,當然也可以逆著推,後者則被稱之為邏輯迴歸。
3樓:善良的可愛巴巴
所謂的邏輯迴歸也可以說成是逆向思維,就是對於乙個問題邏輯正向可以推倒,當然逆著也能推倒。後者責被稱為邏輯迴歸。
4樓:情感助理小林
所謂的邏輯迴歸其實就是逆向思維,你對乙個問題邏輯正的也能推,逆著也能推。後者稱為邏輯迴歸。
5樓:匿名使用者
邏輯迴歸 啟發 推導。
線性迴歸,logistic迴歸和cox迴歸的區別
6樓:瓊羋
1、多重線性迴歸:用於尋找連續性因變數。
數值隨多個自變數。
變化而變化的直線趨勢;強調因變數為連續變數。如研究肺癌。
患者某腫瘤標記物的水平(連續變數)是否受年齡、性別、吸菸與否及數量等自變數的影響。
2、logistic迴歸:用於分析分類變數(或等級變數)和一些影響因素之間的關係,由於因變數非連續變數,與自變數間失去了線性關係的可能性,於是經過logit變化,將模型轉換為線性關係;強調因變數為分類變數或等級變數。如研究肺癌患病與否(二分類變數)是否受年齡、性別、吸菸與否及數量等自變數的影響。
以二分類logistic迴歸為例。
3、cox迴歸:用於研究多個因素對結局事件的影響;因變數與二分類logistic迴歸相似,唯一的區別在於cox迴歸的因變數引入了時間因素。如分析肺癌生存時間(二分類變數,含時間因素)是否受年齡、性別、吸菸與否及數量等自變數的影響。
二元logistic迴歸結果解讀是什麼?
7樓:尹師傅工廠
二元logistic迴歸結果解讀是用於因變數為分類滾咐變數。在研究x對於y的影響時,如果y為定量資料,那麼使用多元線性迴歸。
分析spssau通用方法裡面的線性迴歸,如果y為定類資料,那棗備大麼使用logistic迴歸分析。
二元logistic迴歸結果特點
可以將logistic迴歸分析分為3類,分別是二元logistic迴歸分析,多元有序logistic迴歸分析和多元無序logistic迴歸分析,logistic迴歸分析用於研究x對y的影響,並且對x的資料型別。
沒有要求,x可以為定類資料也可以為定量資料。
但要求y必須為定類資料,並且根據y的選項數使用相應的資料分析。
方法,在研究相關因素對樣本將來是否願意購買理財產品。
的影響情況時,性別專業等均為影響因素,而凳豎且明顯的性別和專業屬於定類資料,因此需要進行虛擬啞變數設定,可使用資料處理。
生成變數完成。
logistic迴歸分析適用於
8樓:愛的年華
分析適用於流行病學資料的危險因素分析。
logistic迴歸又稱logistic迴歸分析,主要在流行病學中應用較多,比較常用的情形是探索某疾病的危險因素,根據危險因素**某疾病發生的概率,等等。
例如,想**胃癌。
發生的危險因素,可以選擇兩組人群巧野,一組是胃癌組,一組是非胃癌組,兩組孝衫喊人群肯定有不同的體徵和生活方式等。
這裡的因變數就是是否胃癌,即「是」或「否」,為兩分類變數,自變數。
就可以包括很多了,例如年齡、性別、飲食習慣、幽門螺桿菌感染。
等。<>
自變數既可以是連續的,也可以是分類的。通過logistic迴歸分析,就可以大致瞭解到底哪些因塌槐素是胃癌的危險因素。
二元logistic迴歸結果解讀是什麼?
9樓:帳號已登出
logistic迴歸主要分為三類,一種是因變數為二分類得logistic迴歸。
這種迴歸叫做二項logistic迴歸,一種是因變數為無序多分類得logistic迴歸,比如傾向於選擇哪種產品,這種迴歸叫做多項logistic迴歸。
還有一種是因變數為有序多分類的logistic迴歸,比如病重的程度是高,中,低呀等等,這種迴歸也叫累積logistic迴歸,或者序次logistic迴歸。
logistic迴歸又稱logistic迴歸分析。
是一種廣義的線性迴歸。
分析模型,常用於資料探勘。
疾病自動診斷,經濟**等領域。
例如,**引發疾病的危險因素,並根據危險因素**疾病發生的概率等。以胃癌。
病情分析為例,襪神選擇兩組人群,一組是胃癌組,告毀虧一組是非胃癌組,兩組人群必定具有不同的體徵與生活方式等。
因此因變數就為是否胃癌,值為"是"或"否",自變數就可以包括很多了,如年齡、性別、飲食習慣、幽門餘祥螺桿菌感染。
等。自變數既可以是連續的,也可以是分類的。
然後通過logistic迴歸分析,可以得到自變數的權重,從而可以大致瞭解到底哪些因素是胃癌的危險因素。同時根據該權值可以根據危險因素**乙個人患癌症。
的可能性。
logistic迴歸的應用條件
10樓:小躍郡主
logistic迴歸模型的適用條件如下:
1、 因變數為二分類的分類變數或某事件的發生率,並且歷汪是數值型變數。但是需要注意,重複計數現象指標不適用於logistic迴歸。
2、殘差和因變數都要服從二項分佈。二項分佈對應的是分類變數,所以不是正態分佈,進而不是用最小二乘法,而是最大似然法來解決方程估計和檢驗問題。
3、自變數和logistic概率是線性關係。各觀測物件間相互獨立。
logistic迴歸是一種廣義線性迴歸(generalized linear model),因此與多尺陪重線性迴歸分析有很多相同之處。它們的模型形式基本上相同,都具有 w『x+b,其中w和b是待求引數,其區別在於他們的因變數不同,多重線性迴歸直接將w『x+b作為因變數,即肢困仔y =w『x+b。
而logistic迴歸則通過函式l將w『x+b對應乙個隱狀態p,p =l(w『x+b),然後根據p 與1-p的大小決定因變數的值。如果l是logistic函式,就是logistic迴歸,如果l是多項式函式就是多項式迴歸。
11樓:網友
logit迴歸分析用於研究x對y的影響,並且對x的資料型別沒有要求,x可以為定類資料(可以做虛擬變數設定),也可以為定量資料,但要求y必須為定類資料,並且根據y的選項數,使用相應的資料分析方法。logit迴歸分析一般可分為三類,分別是二元logit迴歸、多分類logit迴歸、有序logit迴歸,三類logit迴歸區別如下:
1)二元logit迴歸分析,因變數為二分類變數。
2)多分類logit迴歸。因變數為分類資料多組且無序。
3)有序logit迴歸,因變數為分類資料多組且有序。
二元logit迴歸分析用於研究x對於y的影響關係,其中x為定量資料或者定類資料,y為二分類定類資料,(y的數字一定只能為0和1)例如願意和不願意、是和否等。
1)如果x是定類資料,比如性別或學歷漏孫等。那麼就需要首先對它們做虛擬啞變數處理,使用spssau「資料處理」-「生成變數」功能。操作如下圖:
因變數y只能包括數字0和1,如果因變數的原始資料不是這樣,那麼就需要資料編碼,設定成0和1,使用spssau「資料處理」-「資料編碼」功能,操作如下圖:
2)多分類logit迴歸。
只要是logit迴歸,都是研究x對於y的影響,區別在於因變數y上,如果y有多個選項,並且各個選項之間不具有對比意義,例如,1代表「黑龍江省」,2代表「雲南省」,3代表「四川省」,4代表「陝西省」,數值僅代表不同類別,數值大小不具有對比意義,那麼應該使用多分類logit迴歸分析。如果說因變數y的類別個數很多,比如為10個,此時建議時對類別進行組合下,儘量少的減少類別數量,便於後續進行分析。此步驟可通過spssau資料處理模組的資料編碼功能完成。
在「進階方法」模組中選擇「多分類logit」方法,將y定類變數放於上方分析框內,x定類/定量變數放於下方分析框內,點選「開始分析」即可。
有序logit迴歸:
只要是logit迴歸,都是研究x對於y的影響,區別在於因變數y上,如果y有多個選項,並且各個選項之間具有對比意義,例如:1代表不滿意,2代表一般,3代表滿意就返返鏈可以使用有序logit迴歸分析。
在「進階方法」模組中選擇「有序logit」方法,將y定類變數放於上方分析框內,x定類/定量變數放於下方分析框內,點選「開始分世念析」即可。
logistic迴歸不能用於
12樓:馮家劉姑娘
logistic迴歸不能用於:發病**。
可以從兩方面考慮:
一是數理考慮:細心的你會發現,條件logistic迴歸方程是沒有b0常數項的,該常鉛喚數項在建模過程中因為分子和分母都存在被約除了。而喪失b0項的方程嫌態,是沒法估計準確的。
二是:大家想一想,條件logistic迴歸是配對或者配比設計,即認為對病例和對照進行了選擇匹配。即病例與對照並不能代表全人群資料,因芹激源此**必然不準。
意思是研究的物件應該來自全人群的乙個隨機抽樣的樣本,這樣的樣本才具有代表性,可是條件logistic迴歸不是。
該如何正確理解密宗,如何正確理解「思維方式」
續上師五十法頌 徵求意見稿 佛教密宗又稱作密乘,密乘涵蓋了大乘佛教和小乘佛教,屬佛教修習方法的最高層次,是即身成佛的法門。第一佛蓮花生大士把佛教密宗的法脈傳承帶到 根據藏民族的特點並結合當時 宗教的一些儀軌創立了 的密宗 寧瑪派,又稱紅教。藏傳佛教密宗簡稱藏密,至今逐漸發展為四大教派,寧瑪派一直是傳...
正確的信仰應該怎樣確立,怎樣正確理解宗教信仰?
信仰有宗教 bai信仰和非宗教du信仰 即 人文 哲學 主zhi義等dao 宗教信仰要小心,以正直回誠實謹慎答的心去探求。因為宗教涉及靈界,人是血肉之軀,接觸相關靈界問題務必審慎。所以中國古人說,敬鬼神而遠之。可惜現代人依仗掌握科技知識就狂妄自大,輕忽靈界力量,草率進入,不自量力,很容易誤入歧途,走...
我們應怎樣正確認識佛教,如何正確理解佛教
平等心學習實踐得出自己真實體會。佛教是出世間法。要以出離心認識。釋迦牟尼佛並沒有建立佛教,只是後來的人把它看做是教,即佛教。具體詳情,可以深入學習便會知道了。建議樓主看看 正信的佛教 1.佛教即佛陀的教育,對於佛教,世人所稱之 宗教 同佛門自稱之 宗教 不同,佛門自稱宗教是因 宗門 和 教下 的總稱...