25 Oct 2018

[SAS] 문자 관련 함수 (compress, index, substr, length, trim, upcase, lowcase)


DATA practice;

bbb=BYTE(65);                                      
bbb에는 문자 A 가 저장 (ASCII 코드로 65는 영어 대문자 A이다)

ccc="안녕 하세요"; 
'안녕 하세요' 가운데 빈칸이 하나 있다

cccc="안녕  하세요";
공백부분을 탭으로 띄워진 부분이다

nccc=COMPRESS(ccc,' ');
빈칸이 없어진다

a=COMPRESS(ccc);
중간에 공백(스페이스)인 경우는 굳이 위와 같이 ' '를 사용하지 않아도 없어진다

aa=COMPRESS(cccc, ' ');
이렇게 하면 중간에 공백 외에 탭 등이 들어 있는 경우 삭제할때는 다음과 같이 하면 없어진다.

size1=LENGTH(ccc);
길이가 11 한글 5글짜에 빈칸 하나

size2=LENGTH(nccc);
빈칸이 없어졌으므로 길이가 10

size3=LENGTH(bbb);
길이가 1

large=UPCASE('Good Morning');  (compress, index, substr, length, trim, upcase, lowcase, ...)
'GOOD MORNING' 으로 바뀜

small=LOWCASE('Good Morning');
'good morning' 으로 바뀜 

str=SUBSTR(large,2,4);
변수 large의 2번째부터 4문자를 선택

run
;


몇몇 명령어만 살펴보면
bbb는 ASCII의 65인 A가 들어가 있고,
aa는 문자 사이에 공백외에 다른 기호가 들어가 있을때 제거할때 유용하게 쓰인다.
substr은 변수내에서 원하는 위치의 값만 가져올때 사용된다.



substr결과만 한번 살펴보면 substr(large,2,4)로 되어있는데
위에서 large의 변수에는 GOOD MORNING 이라는 값을 가지게 된다.(대문자로 변환하였으므로...)
GOOD MORNING 에서 2번째 값부터 4개의 값을 가지고 오라고 되어 있으므로, OOD 을 가져온다. OOD 다음에 공백값까지 4자리를 가져오기 때문에 아래 결과에서 str의 변수값에서 OOD 값만 가져오는 것이다.

No comments

Copyright © 2018 Mid Air by Ahny. Powered by Blogger.