什麼樣的人是帥哥/美女?
這個問題其實還蠻主觀的不是嗎? 因為美其實是充滿主觀的。有沒有什麼統計技術可以協助我們判斷? 區別分析就是一個很好的技術,它可以根據一些決策變數(判斷帥哥/美女的變數)來建立模型看看。 建模: 若以美女為例,它的模型長相: 應變數: 是美女/不是美女 自變數: 決策變數像是眼睛大小、顏質、皮膚白皙、骨骼對稱 應用: 區別分析還可以用在,區別好的公司與不好的公司、區別成功與失敗的創業家,但一樣,自變數的選擇很重要! 難題: 區別分析最難的地方就是要取得一個客觀的數據資料,然後才能用來建模,若是以區別美女這個議題,這意味著剛開始就要有一組數據,譬如500個女性,然後會都會先決定這500位是美女或不是美女,這其實就不是很容易的! 但是如果是判斷公司是成功或不成功,相較起來就容易得多了,因為有比較客觀的指標。此外,光是自變數就很難選了,因為要客觀地去選,這可能要根據選美專家的建議了! 像是我列的顏質這個變數感覺就蠻主觀,可能不太行! 那看來我們要用區別分析來看有沒有論文抄襲、看看是否好學生壞學生,是不是是美女,這些議題都不是容易的事情了,因為往往會涉及到很多主觀與意識形態。不要以為統計模型就是萬能的,還是會有主觀的成分,但是這些還是有助於我們做決策,只是我們要有智慧,知道這些模型是否可靠? 區別分析要怎麼看模型好壞? 就讓我們之後再說! 一起簡單學,做的好!
0 評論
看我的教學影片都會知道我很喜歡揮手,而且很好效也很有魔力的是,揮手很有感染力,當一個人揮手,就會吸引另外一個人揮手,然後繼續吸引別人揮手,直到一堆人揮手! 到底揮手有什麼意義呢? 有一次我聽我弟弟分享他上課時大學教授的趣味事件,好像是一門理工的課程,很難,台下同學問老師可不可以作業給詳解,老師就說,詳解給你們就不有趣了,想要詳解,自己算,然後就揮了手。 從此揮手就和自己算綁在一起! 感覺就是自己去享受解題的過程,不靠別人,最後成功解出來的那種爽快感覺! 現在我們聽過有太多案例不想學,只想靠別人解決問題,到最後發生很多問題! 像是最近的論文抄襲案例,就有可能是將自己的論文交給別人,自己卻無參與太多,不知道發生什麼事,導致論文後來問題很多。我們要知道,既然是要讀碩士或是讀博士,論文是必經的路,找文獻、發想研究架構、收資料跑資料,如果都沒有參與,就會學不到東西也會失去讀碩士或是博士的意義性。坊間也有很多統計代跑服務,會讓你無法簡單學做得好! 統計雖然是一門不好懂的學問,但是學了他就可以提升數據處理的能力,這在大數據的時代可以說是基礎,我們希望你來我這裡學習後,可以掌握數據分析的基本概念,最後你也可以驕傲地揮手,因為你靠自己完成了一件艱難的事情! 下次你要揮揮看,因為別人也會回應你的揮手,讓揮手精神傳遞出去吧! 一起簡單學做得好! P值其實是機率的概念,他是假設檢定的專有名詞! 假設檢定中,我們會有虛無假設與對立假設,虛無假設通常是放無效果的假設,而對立假設會放有效果的假設。在這樣的假設下,我們去抽取一個樣本,根據樣本算出一些值來看看這個樣本推翻虛無假設的強度有多強? 也就是p值!
P值其實是”證據強度”,當p值發生機率小於0.05,表示我找到了一個發生機率很低的證據(我的樣本),這種證據通常就是很強的證據可以推翻原先的假設,因為發生機率低,或是說,雖然我的虛無假設假定無差異,但是樣本告訴我們差異很大,表示原先的虛無假定可以被推翻,因此就接受對立假定的”有差異”結論。 至於p值為何要低於0.05,這個就是統計學家的共識! 他們認為證據發生的機率要低於0.05才算是一個可接受的強烈證據,當然如果你要嚴格一點,妳可以訂要低於0.01甚或是0.001,如果要寬鬆點就是訂0.10。 統計檢定就是用樣本特性推論母體特性,如果現在你已經有了母體,那就不用再進行假設檢定囉!
這個時候報導p值或是假設檢定的結果,都是沒有意義的。而很多統計軟體預設都會報導假設檢定的結果,但你現在知道了,當你已經掌握母體的資訊,那你就不用看假設檢定或是P值了! 記得不要再犯檢定病了! 也不要過於相信統計軟體的預設喔! 點了解p值更多 如果你認為統計學就是在搞分析,那你很有可能會得到沒有意義的結果!!!
如果資料沒有品質、衡量很爛,分析再好也沒有用,因為垃圾的資料,再怎麼分析,也只是產生垃圾的結果而已!! 當你執行一個數字專案或是研究時,記得,你要專注的問題並不只只是統計分析的問題而已,還有很多其他的問題,以下我提供一個Checklist給你參考! 之後我們的統計學懶人包就會一一回答這些問題喔! 一起和我簡單學,做的好! 有些抽樣方法是不好的,容易產生爛樣本,通常這些抽樣方法是有偏的,以下就讓我們來舉一些例子。
行銷研究通常會在購物中心透過街訪的方式調查消費者對產品的想法,這樣的抽樣方式是否是適當的? 我們來簡單看兩個例子: 1. 街訪 常逛購物中心的人們通常比較年輕,而且收入比較高,所以抽樣也會吸引到這類的人,況且,街訪人員還會傾向去選擇比較友善的人來進行街訪,會避開看起來兇兇的,壯壯的傢伙,所以這種街頭訪問調查的方式,其實並不是每個人都有相同機會可以參加! 2. 網路問卷 以前的網路問卷也常被視為是一個有偏的樣本,因為那個時候只有少數人上網,通常是對網路很有興趣的人,因此使用網路抽樣就會是一個有偏的方法。然而,現在大家幾乎都可以上網,使用網路已經是每個人的習慣,因此,網路問卷還會是一個有偏的抽樣方法嗎? 如果研究的議題和網路的使用有關且研究的對象習慣於使用網路,那網路問卷也不一定會產生偏的樣本。 不管你要採用的抽樣方式是什麼,記得,盡量不要產生有偏的樣本! 要怎麼樣產生一個不偏的樣本,就是要盡量讓母體中每個人有相同的機會可以來參加調查。隨機抽樣是一個好方式,讓我們之後再說吧! 一起簡單學,做得好! 近來大數據分析很夯,我在學校教書都常常會聽到,現在是大數據時代了,還在教什麼統計學,落伍了!!! 大數據時代下,根本不需要進行傳統統計的推論,因為數據已經很大了,抽樣誤差就會很小,可以忽略,此時實行統計推論的意義性就降低。
就如同你所聽到的,很多人都認為傳統統計會被大數據分析給取代,但是我認為不盡然,首先,傳統統計教的技術很多也是大數據分析的基礎,像是集群分析,還有就是描述性統計還有預測分析,這些也是傳統統計的範圍,在大數據分析時並無消失,只是說要預測要描述的資料變的很多很多!並非每個企業在經營時都會需要龐大數據,對於Google與Facebook這些有海量數據的公司,或許是如此,但規模比較小的企業是否需要? 我覺得,對於我們來說,都要好好學習,以備不時之需阿,鬍鬚曾最近也在學R大數據分析軟體,感覺進到了一個新的世界,但學習就是一件很有趣的事情啊! 就像我一直以來希望你們一起簡單學、做得好,其實我也一直在簡單學做得好! 要一直學習一直進步,才不會被時代所淘汰! 我的觀點是認為這兩種分析是可以互補的,那你的呢? |
我是誰鬍鬚曾,政大博士,為人和善客氣,看起來呆呆萌萌的,喜歡分享簡單統計知識,熱心幫助有需要的人,做事認真,常常忘記要照顧自己 查文章
十月 2022
類別 |