tFileInputDelimited Component로 파일을 읽고, tExtractRegexFields에서 정규식으로 뽑아내서 원하는 스키마에 저장하는 것으로 보입니다.
email -> name, domain, tld로 뽑아냄.
그런데 "([a-z]-)@([a-z]-).([a-z]-)" 이 정규식 부분에서
무조건 순서대로 name, domain, tld 로 extract 되는 것인가요?
아니면 직접 부분을 선택해서 원하는 field로 추출해 내는 것이 가능한지요?
답변 부탁드립니다. 감사합니다.
번호 | 제목 | 글쓴이 | 조회 수 | 날짜 |
---|---|---|---|---|
11 | DB 세션관련 문의입니다. [1] | ama | 204 | 2021.11.24 |
10 | ETL 작업관련 문의 입니다. [1] | ama | 141 | 2021.11.12 |
9 | build job 이후 .zip파일이 생성되지 않습니다. | dhlee | 76 | 2021.08.24 |
8 | downloadlink | sayhoon | 105 | 2021.06.28 |
7 | job.properties | NEXUS | 21007 | 2019.09.19 |
6 | mysql8 지원문의 [1] | shkang9 | 12 | 2019.02.26 |
5 | 구글 빅쿼리(BigQuery) 연동 문의 | 미스터손 | 9 | 2018.09.27 |
4 | Scheduler 문의 [4] | ETL최고 | 1015 | 2017.03.09 |
3 | IQDesigner에서 작업공유 [3] | moongk813 | 3967 | 2016.12.12 |
2 | IQServer에서 System mail 패스워드가 그대로 노출됩니다. [1] | bongslee | 5016 | 2016.03.09 |
» | tExtractRegexFields sample job 관련 질문입니다. [1] | clovery | 5522 | 2016.03.08 |
직접 부분을 선택 한다는 것은 자리수 또는 Delimiter 를 지정하여 원하는 데이터를 뽑아내는것을 말합니다.
email 의 경우 Delimiter를 @ 로 해서 아이들 추출하고
문자열의 처음 부터 '@' 까지는 ID
'@' 에서 '.' 까지는 domain
'@' 다음 '.' 에서부터 '.' 까지 tld 로 추출 하면 됩니다.