R軟體如何讀取文字資料?

來源:酷知科普網 2.53W

R軟體中有很多程式包,比如RCurl、XML、rvest,以及R的基礎包,都有函式可以讀取文字資料,下面我們就來介紹下具體的使用方法。

操作方法

(01)對於網頁為csv檔案的頁面,可以直接用函式匯入網頁資料並轉為資料框的形式。html格式的網頁也可以讀取。例如:data <- (text="it is a page")#text是要檢視的文字head(data,10)#讀取網頁資料的程式碼data <- ("page"),page可以是要檢視的網址或文字

R軟體如何讀取文字資料?

(02)R基礎包中的readLines可以讀取網頁或文字資料。#輸入文字cat("asqsdn1213",file="a1")readLines("a1") #讀取文字資料#cat中"n"表示換行。

R軟體如何讀取文字資料? 第2張

(03)RCurl包中的getURL()函式獲取網頁資料。library(RCurl)data<-getURL("a1")#a1為某個具體的網址。head(data)

R軟體如何讀取文字資料? 第3張

(04)通過getURL直接獲取的資料有些凌亂,可以藉助library(XML)解析樹函式htmlTreeParse處理。library(XML)#解析樹函式htmlTreeParsedata_Parse<-htmlTreeParse(data)head(data_Parse,2)

R軟體如何讀取文字資料? 第4張

(05)對於複雜網站的文字資料,用rvest包中的read_html函式來提取文字資料。library(rvest)page<-read_html("a1")#a1為某個具體的網址data<-html_nodes(page,"table")head(data)#本例中沒有輸入網址,所以結果為空。

R軟體如何讀取文字資料? 第5張

(06)通過html_nodes獲得的資料不能直接投入使用。table<-html_table(data);table #提取表格資料,可以得到多個表格結果table[1]#檢視第1個表text<-html_text(data);text #提取文字資料#在實際應用中,可以發現提取表格後的資料或文字是非常便於分析的。

R軟體如何讀取文字資料? 第6張
熱門標籤