제육's 휘발성 코딩
Published 2021. 11. 17. 17:29
[R] - 데이터 수집 Big Data
반응형

파일 종류

  • TXT : 일반 문자열이 저장된 텍스트 파일
  • CSV : Comma-Separated Values (필드를 콤마로 구분한 텍스트 파일)
  • TSV : Tab-Separated Values : 필드를 \t(탭)으로 구분한 텍스트 파일
  • EXCEL : 스프레드시트를 이용한 엑셀의 데이터 파일

파일 데이터 수집

  • 파일 읽어오는 함수
    • scan, read.table, read.csv, read.delim
  • 파일 쓰는 함수
    • write.table, write.csv, write.xlsx

scan

  • scan 함수는 키보드를 통해 값을 직접 입력하거나 지정된 파일을 읽는 함수
scan("") # scan("")을 입력하면 키보드 입력 대기 
1: 1 2 3 # 처음 입력
4:  # 공백 엔터 시 결과 출력
Read 3 items
[1] 1 2 3 # 결과

table(r/w)

  • TXT 파일로부터 데이터를 읽어오는 함수
#header(T) : 첫 행을 열 이름으로 인식 , fill : 비어있는 부분을 NA로 채울지 여부 결정(기본 F)
df <- read.table(file = "write.txt", header = TRUE) 
df
# append(T) : 이어쓰기, F : 덮어쓰기 (디폴트), quote(T) : 모든 값에 ""수식  
write.table(iris, file = "write.txt") 

csv(r/w)

  • CSV 파일로부터 데이터를 수집하는 함수
csv_data <- read.csv(file = "data.csv", header=TRUE)
csv_data
write.csv(csv_data, file="write.csv") #csv_data의 데이터를 write.csv 파일에 쓴다. 

read.delim

  • read.delim 함수는 구분자 tab을 자동 인식하는 함수
  • tsv 파일을 읽을 때 read.delim 함수 이용
tsv_data <- read.delim(file="data.tsv", header=TRUE)
tsv_data
write.table(tsv_data, file="write.csv", sep="\t") #tab을 구분자로 하여 데이터를 쓴다.

excel(r/w)

excel_data <- read_excel(path="data.xlsx", sheet="Sheet1", range="A1:B4", col_names=TRUE)
View(excel_data) #excel_data를 출력 
write.xlsx(excel_data, file="write.xlsx") 
반응형
profile

제육's 휘발성 코딩

@sasca37

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요! 맞구독은 언제나 환영입니다^^