tFileInputDelimited Component로 파일을 읽고, tExtractRegexFields에서 정규식으로 뽑아내서 원하는 스키마에 저장하는 것으로 보입니다.
email -> name, domain, tld로 뽑아냄.
그런데 "([a-z]-)@([a-z]-).([a-z]-)" 이 정규식 부분에서
무조건 순서대로 name, domain, tld 로 extract 되는 것인가요?
아니면 직접 부분을 선택해서 원하는 field로 추출해 내는 것이 가능한지요?
답변 부탁드립니다. 감사합니다.
직접 부분을 선택 한다는 것은 자리수 또는 Delimiter 를 지정하여 원하는 데이터를 뽑아내는것을 말합니다.
email 의 경우 Delimiter를 @ 로 해서 아이들 추출하고
문자열의 처음 부터 '@' 까지는 ID
'@' 에서 '.' 까지는 domain
'@' 다음 '.' 에서부터 '.' 까지 tld 로 추출 하면 됩니다.