如何在stata中生成虛擬變數(各種情況)?

來源:酷知科普網 3.15W

類別虛擬變數

(01)雙類別虛擬變數,顧明思議就是將變數分成兩類進行虛擬變數的生成。如性別等等。我們還是開啟我們的老朋友ysuse autogen d=(length>200)聰明的大家一看就知道,這樣就可以生成一個雙分類虛擬變數,也就是>200的是一個小於等於200的是一個。圖片是原始資料和生成的虛擬變數的截圖

如何在stata中生成虛擬變數(各種情況)?
如何在stata中生成虛擬變數(各種情況)? 第2張

多類別單分類虛擬變數生成

(01)什麼是多類別虛擬變數?就是把一個變數的每一個數都分成一類類,我們在生成分類變數時也就是做這一種最容易出現問題。通常需要分類的變數時,季度變數還有不同的廠商,等等。

如何在stata中生成虛擬變數(各種情況)? 第3張

(02)觀察步驟1中的圖片,我們現在相對不同廠商進行分類,這就很難受了。如果,我們想對每一個廠商都進行分類,我們需要使用上面教的gen命令很多次。這個樣本的數量級別還好,如果數量級別更大,我們將很難處理這類問題。這時我們可以使用:tab命令help tab我們檢視tabulate命令的help,可以發現有一個生成虛擬變數的方法。

如何在stata中生成虛擬變數(各種情況)? 第4張

(03)使用tab make,gen(m)即可生成按照make不同生成虛擬變數

如何在stata中生成虛擬變數(各種情況)? 第5張
如何在stata中生成虛擬變數(各種情況)? 第6張

單變數多分類虛擬變數生成

(01)什麼意思呢?就是對單一變數進行劃分,將多個不同的資料劃分成一類。這其實是非常常用的掌握了對大家都很有好處。其實,生成虛擬變數,如果你是個愣頭青,你直接看著資料挨個輸入就好。但是,還是希望大家都能靈活掌握stata的技巧,快人一大步。觀察下面的資料表,是筆者我自己下載的資料,這個是一個時間的資料。這種資料是非常非常常用的,你從資料庫下載的季度資料都是這個格式的資料。有時候你會遇到這樣的問題。如果我想按季節分類怎麼辦呢?

如何在stata中生成虛擬變數(各種情況)? 第7張

(02)我在這裡教大家一種我用的辦法,是我自己在實踐中總結,可能有更簡單的命令,如果你知道可以和我聯絡,我會加一補充。第一步 生成分類變數:gen group=0replace group=1 if regexm(t,"-03-")replace group=2 if regexm(t,"-06-")replace group=3 if regexm(t,"-09-")replace group=4 if regexm(t,"-12-")

如何在stata中生成虛擬變數(各種情況)? 第8張

(03)tab group,gen(season)

如何在stata中生成虛擬變數(各種情況)? 第9張
如何在stata中生成虛擬變數(各種情況)? 第10張

特別提示

虛擬變數的生成無非是這幾類,靈活思考一般可以解決問題

有任何疑問都可以向我提問

熱門標籤