반응형
파일 종류
- TXT : 일반 문자열이 저장된 텍스트 파일
- CSV : Comma-Separated Values (필드를 콤마로 구분한 텍스트 파일)
- TSV : Tab-Separated Values : 필드를 \t(탭)으로 구분한 텍스트 파일
- EXCEL : 스프레드시트를 이용한 엑셀의 데이터 파일
파일 데이터 수집
- 파일 읽어오는 함수
- scan, read.table, read.csv, read.delim
- 파일 쓰는 함수
- write.table, write.csv, write.xlsx
scan
- scan 함수는 키보드를 통해 값을 직접 입력하거나 지정된 파일을 읽는 함수
scan("") # scan("")을 입력하면 키보드 입력 대기
1: 1 2 3 # 처음 입력
4: # 공백 엔터 시 결과 출력
Read 3 items
[1] 1 2 3 # 결과
table(r/w)
- TXT 파일로부터 데이터를 읽어오는 함수
#header(T) : 첫 행을 열 이름으로 인식 , fill : 비어있는 부분을 NA로 채울지 여부 결정(기본 F)
df <- read.table(file = "write.txt", header = TRUE)
df
# append(T) : 이어쓰기, F : 덮어쓰기 (디폴트), quote(T) : 모든 값에 ""수식
write.table(iris, file = "write.txt")
csv(r/w)
- CSV 파일로부터 데이터를 수집하는 함수
csv_data <- read.csv(file = "data.csv", header=TRUE)
csv_data
write.csv(csv_data, file="write.csv") #csv_data의 데이터를 write.csv 파일에 쓴다.
read.delim
- read.delim 함수는 구분자 tab을 자동 인식하는 함수
- tsv 파일을 읽을 때 read.delim 함수 이용
tsv_data <- read.delim(file="data.tsv", header=TRUE)
tsv_data
write.table(tsv_data, file="write.csv", sep="\t") #tab을 구분자로 하여 데이터를 쓴다.
excel(r/w)
excel_data <- read_excel(path="data.xlsx", sheet="Sheet1", range="A1:B4", col_names=TRUE)
View(excel_data) #excel_data를 출력
write.xlsx(excel_data, file="write.xlsx")
반응형